2022年10月20日
几十年来,心血管疾病一直是头号死因。仅在2019年,全球就有近1,800万人死于心血管疾病(CVD),包括冠心病、心力衰竭和脑血管疾病等等。其中大多数死亡由心脏病发作或中风造成。
虽然由于预防和治疗策略的改进,新的心血管疾病发生率在稳步下降,但由于人口老龄化,目前受其影响的人口比例仍在增加。德国的心脏病死亡率位列全球第14位,在经济合作与发展组织(OECD)国家中,每10个人中至少有1个人死于心脏病。
这样一个如此普遍的问题不仅需要在人口规模上加以关注,也需要聚焦于分子水平。瑞士非营利性研究机构Cardio-CARE的科学总监兼CEO Andreas Ziegler教授正在使用基因组学来研究居住在汉堡的数千名居民的健康状况。Cardio-CARE位于达沃斯湖附近,其致力于心血管研究,尤其专注于确定药物靶点并开发工具以改善CVD诊断和预后。“如果你能够更好地了解导致特定心血管疾病的机制,那么你也许能够推导出一些治疗或预防方法,”Ziegler说道,“如果你能确定一个新基因,比如可能与一个人是否在年轻时发生心肌梗塞有关的基因,那么这可能是一个潜在的药物靶点。”
想想表型数据的丰富性。我们可以对现有的基因数据进行多年的分析。
全球最大的本地队列
Cardio-CARE是物流巨头Klaus-Michael Kühne的心血结晶。他的祖父是全球最大的第三方物流公司之一Kühne + Nagel International AG的创始人之一,该公司负责在全球范围内分销Moderna的COVID-19疫苗。Ziegler说:“在我看来,Kühne先生是德国和欧洲物流和运输方面举足轻重的人物。”20世纪70年代,Kühne的家族成立了Kühne基金会,为Cardio-CARE提供资金。
Kühne的出生地目前是全球最大的基于人群的本地队列研究中心:汉堡市健康研究(HCHS)正在招募45-75岁的汉堡居民,迄今为止已招募超过17,000人,并且参与者需要遵守承诺。该研究的独特特征之一是其广泛而全面的表型分析;因此,其基线检查每人持续6-7个小时。每个受试者都要接受详细的评估,包括2D和3D超声心动图、肺功能测试、牙科检查和皮肤筛查。此外还会接受神经和心脏磁共振成像(MRI)检查。
Cardio-CARE已经获得了来自8,000多名研究参与者以及另外1,000名患有特定心血管疾病(如青年心肌梗塞(MI))的患者的全基因组序列数据。有了这些数据,Ziegler和他的团队将能进行相关研究,例如与人群对照组相比,患有MI的受试者是否具有更高频率的特定突变。“想想表型数据的丰富性,”Ziegler说,“我们可以对现有的基因数据进行多年的分析。”
使用DRAGEN
HCHS于2019年11月在苏黎世进行了首次测序;与此同时,在大约150公里外的达沃斯,Cardio-CARE开始面临重大阻碍。一个是官僚主义:由于瑞士不是欧盟成员,因此需要额外的时间来完成必要的数据保护和交换文档。另一个是技术:他们必须创建一个高性能计算集群,以处理、分析和存储9,000个样本的原始序列数据——估计需要约1 PB,大约1,000台笔记本电脑的容量。
Cardio-CARE购买了两台Illumina DRAGEN服务器,将数据处理时间缩短至约120天。此外,DRAGEN ORA压缩软件 将存储占用空间减少了约80%。原始数据的存档工作现在只需10多个外部硬盘就可以完成,不再需要50个硬盘。
由于DRAGEN分析速度快,Cardio-CARE团队决定使用其对WGS数据进行二级分析。在项目实施过程中,团队还发现DRAGEN具有较高的准确性。
Ziegler创建了一个由10人组成的实验室,其中包括生物信息学家、计算机科学家和生物统计学家,他们在计算机方面的大量培训和分析技能将在准备、分析和处理数据的工作中发挥重要作用。汉堡埃普多夫大学医学中心(由Kühne基金会资助)的两位教授参与了Cardio-CARE项目,负责一部分重要工作:Stefan Blankenberg是心脏和血管中心心内科主任;Raphael Twerenbold是临床心脏病学教授,专注于基因组学和生物标志物研究。
经过近三年的准备,目前他们正在整合表型数据与基因数据,并开始第一次以临床为重点的真实数据分析。这是一段漫长的旅程,Ziegler非常感谢所有同事的努力,感谢Kühne基金会的资助,使他们有机会研究这些重要数据。有朝一日,这些数据可能会对心血管疾病的诊断、预后和治疗产生全球性影响。