基因测序在抗击新冠病毒的战役中发挥了十分巨大的作用。依靠高通量测序技术及时获得病毒基因组序列,全面分析病毒基因,为疫情防控、临床治疗及后续研究都提供了重要帮助,而增加对新冠病毒的常规测序并将其共享报告,对于及时发现变异,采取有效应对措施都具有关键意义。

新冠病毒作为正链RNA病毒,使用测序数据来揭示其突变并不是难事,然而想要究其基因表达则变得极为困难,而这棘手之处就在于病毒用于表达的sgRNA与病毒基因组gRNA通常很难区分开来。
那么,要如何突破这一难题呢?

2021年3月17日,欧洲杯竞猜平台临床研究中心特邀上海市免疫学研究所的研究员陈磊老师作为中心第八期“聚菁荟萃”临床研究精品论坛的嘉宾,进行了一场主题为“新冠病毒的转录组数据挖掘”的学术讲座。


为了还原sgRNA的相对比例及表达量,将sgRNA与gRNA进行区分,陈磊老师的团队开发了CORONOTATOR这一工具,从转录组测序数据中还原病毒各基因表达量。利用这把利器,分析了来自20个项目的600个新冠病毒样本数据并对比了新冠病毒与SARS及MERS等人冠状病毒的基因表达特点,并提示sgRNA编码保守的结构蛋白S的高表达与新冠病毒超越物种壁垒并在人群广泛传播呈正相关。

陈磊老师的讲座让中心老师对于新冠病毒的基因组及亚基因组有了一定认识,不仅如此,他还从测序数据挖掘及存储角度,为中心结直肠癌先导项目的数据管理提出了科学的建议和指导,使得中心能从NCBI Short Read Archive (SRA) 的设计架构中获得借鉴和启发,建立适合项目本身的数管体系,从而更加规范、科学地对样本数据进行使用和管理。
(文:顾雯韵;图:顾雯韵)