中心快讯

如何有效在高维数据中筛选出和治疗影响相关的协变量

发布日期:2023-05-26 16:15  点击数:

精准医疗通过基于每一位患者独特的健康状况和特征来定制个性化方案从而实现患者获益最大化,要实现这一点有赖于生物医学科学、遗传学、统计学、心理学等多学科进行交叉合作,形成数据驱动的循证决策。考虑到不同患者对疗效的响应各不相同,传统“one-size-fits-all”的这种一刀切的做法已不再是最佳治疗选择。因此,诸如肿瘤、糖尿病、心脏病这些常见慢性病而言,治疗决策总是根据不同的患者来进行调整,这便驱动研究者去探索个性化治疗方式(ITR, Individual Treatment Regimes)。利用个性化数据作治疗方案的推荐和决策是近五年来的流行做法,当产生诸如遗传信息、医疗记录等大量基于患者个人的特征数据时,通过高效筛选出与治疗影响相关的协变量就成为了临床最佳决策的关键,然而现有的许多方法聚焦于估计ITRs,它们并不能在个性化决策中进行变量选择,尤其是在应用于多分类治疗时。

2023525日,来自华东师范大学统计学院的徐进教授应邀来到欧洲杯竞猜平台临床研究中心并作主题为“Model-free screening for variables with treatment interaction”的学术报告。他提出一种model-free的方法,在应用于高维数据时可以有效度量出治疗和协变量之间的交互作用。

通过对既往ITR的各种方法,包括Q-learning, A-learning, D-learning,以及变量选择的介绍,徐进教授定义了他所提出的方法中在连续性的结果下,任意两个不同治疗方案,如果给定协变量,分布函数是依赖于具体某一特定协变量的话,这就是要寻找的目标协变量。这就好比,性别这一变量,可能在某些疫苗接种时,男女之间并无显著差异,而在有些治疗情况下,性别差异则显现了。该方法不考虑删失,通过对协变量做中心化处理,筛选出相关信号进行扫描、排序,而后,通过结合了hard thresholdsoft thresholdthresholding过程来判断变量是否为目标变量。在实际应用层面可以发现,徐进教授的方法可以最大限度捕获到目标变量,具有效率高、计算简便、应用广泛且支持多分类治疗的优势。


上海市黄浦区重庆南路227号科教楼7楼   200025   021-63846590