医学部本科生在生物信息学国际顶级期刊发表第一作者论文
深圳大学医学部临床2014级本科生惠馨颉在生物信息学国际顶级期刊《Bioinformatics》发表研究论文“EBT: A Statistic Test Identifying Moderate Size of Significant Features with Balanced Power and Precision for Genome-wide Rate Comparisons”(https://doi.org/10.1093/bioinformatics/btx294)。惠馨颉同学为该论文第一作者,指导老师汪业军为通讯作者,深圳大学为第一单位及第一通讯单位。项目由大创基金和深圳大学新教师启动基金共同资助。
大数据和精准医学研究涉及大量的基因组水平的分析,而基因组水平率比较的低统计功效一直是领域内的一个巨大挑战。传统的卡方检验、Fisher精确检验以及二项式检验均产生大量的假阳性,而Bonferroni、FDR等多重检验校正方法的使用又急剧增加了假阴性结果,导致最终的“多”或“无”阳性结果,使得实验研究人员无所适从。
围绕着“开发一个平衡基因组水平率比较的功效和准确性的统计方案”,惠馨颉同学在指导老师和团队其他研究人员的协助下,将一个率的比较问题转化成两个二项分布的联合概率求解,并且从假设到实现,对方法进行系统化,开发出EBT。从理论和模拟数据层面证实方法在统计功效和准确性之间的平衡效果(如图所示);利用实际数据证实EBT在基因组水平研究中应用的意义。除了平衡率比较的假阳性和假阴性,研究组还证实了使用EBT在机器学习特征选取方面的优势。利用EBT,鉴定了一组(45个)肺鳞癌和腺癌体细胞突变率显著差异的基因;利用这些基因作为生物标记物(特征),可以高准确地区分两种不同组织来源的肺癌类型。EBT被开发成R软件包,已经申请软件著作权,非商业应用可以通过下面链接免费获取该软件包:http://www.szu-bioinf.org/EBT。肺鳞癌和腺癌的鉴别模型目前也在申请软件著作权。近期,惠馨颉和指导老师团队已经将该方法成功应用于子痫发病风险因子鉴定、头颈癌化疗方案选择、肺腺癌和前列腺癌预后分析的研究中。EBT为精准医学和基因组医学特征比较研究提供了一个实践层面的方法选择。
《Bioinformatics》是生物信息学领域的国际顶级期刊,影响因子为5.77,5年影响子为7.5,中科院分区(数学和计算生物学)1区期刊。
用户登录
还没有账号?
立即注册