GLOBAL临床研究证明了基于泛组学的药物发现方法的价值
简介
Szilard Voros(医学博士)在弗吉尼亚大学接受心脏病学培训时,对药物研发和企业创新产生了兴趣。之后,他致力于用心血管成像来支持依替米贝(一种降低胆固醇的原创药物)的开发。Voros博士后来去了乔治亚州亚特兰大市的皮埃蒙特心脏研究所,在那里,他和他的团队开发了一种可以对不同器官内的疾病过程进行成像和测量的新方法。他们很快启动了各种项目,将开发的成像技术与基因组学、蛋白质组学和代谢组学相结合,这种多组学方法,他们现在称之为泛组学。
2011年初,Voros博士清楚地认识到,整合所有的这些数据可以显著改善药物和生物标记的发现和开发过程。它还可以为医生提供信息,助其了解疾病过程的状态,并告知患者最有效的预防和治疗方法。他创立了Global Genomics Group(G3),并开始在一项开创性的国际临床研究中证明他的泛组学方法的潜力,该研究被恰当地命名为“动脉粥样硬化病变的遗传位点和负荷(Genetic Loci and the Burden of Atherosclerotic Lesions, GLOBAL)”研究。
7年的时间,7000多个临床试验对象以及数万亿个数据点证明了Voros博士是个极有远见的人。G3已经成功地将成像、泛组学和数据分析整合到了一个强大的药物发现引擎中。该公司已经证明了这项新方法的价值,他们引入了一种新的诊断方法,并与制药合作伙伴共同开发了几种候选药物。
iCommunity采访了Voros博士,探询了G3团队如何开发和优化他们的泛组学方法以及由此产生的诊断和治疗计划,了解了Illumina的产品和系统如何帮助他们取得成功。
Szilard Voros(医学博士)是G3的创始人兼首席执行官。
Q:您为什么创立G3?
Szilard Voros(SV):G3的部分灵感来源于我作为一名执业医师的挫败感。我当时正在负责一个预防心脏病学计划,其间的会见患者、循证实践、以指南为导向的用药,关注的都是群体而不是个人。这令我感到非常沮丧。我感觉自己并没有对我的患者的生活质量产生积极的影响。我那时候觉得我们已经到了21世纪,必须要有更好的办法。
在我早期的学术生涯中,我们开发了新的成像方法和技术来支持新的心血管药物的鉴定。它们本质上是表型分析工具,提供了特异的定量方法来确定和测量疾病的不同方面。我创立了这家公司,开始确定如何将成像数据与泛组学数据整合起来,并使用先进的分析技术对其进行全面分析。
Q:在创立G3时您遇到过困难吗?
SV:这是一项艰巨的任务。我们想把所有不同的组学技术整合到一个公司中,作为一个项目来实现一个目标。在当时,这个领域还相当地孤立无援。当时已经有基因组学、蛋白质组学、代谢组学和宏基因组学公司,但他们并不使用同一种技术语言。没有人尝试过整合这些数据集。从概念、系统和信息上来看,没有一种方法可以把所有的这些信息转换成通用的词汇。
Q:创建新方法的过程中最大的未知因素是什么?
SV:最大的未知因素是我们如何以信息的方式整合数据。我们发现解决方案会以一种平行、协同的方式来使用不同的方法。例如,我们会将全基因组关联研究(GWAS)与数量性状基因位点(QTL)分析相结合,将孟德尔随机化与贝叶斯网络分析相结合。这是一种能根据分析目标的不同而改变的整合方法。
图1:G3在GLOBAL临床研究中使用了泛组学方法来获取和分析成像、基因组学、转录组学、甲基组学、蛋白质组学和代谢组学/脂质组学的数据,这些数据总共为每个受试者提供了数十亿个数据点。
Q:你们主要关注哪些疾病?
SV:我们关注的是常见的多因素、多基因慢性疾病,例如心血管疾病、脂肪肝、糖尿病、骨质疏松和肥胖。这些疾病会直接影响人类的寿命。我们在用自己的方法来了解、研究和影响这些疾病的病程。
Q:G3的方法是什么?
SV:我们的方法建立在三个基本支柱之上。第一个支柱是使用成像技术来量化疾病的各个方面,进行深度基因分型。第二个支柱是泛组学分析,我们会分析血液样本中的DNA、RNA、蛋白、脂质和其他小分子。第三个支柱是利用系统生物学驱动的生物信息学整合深度基因分型和泛组学的数据。临床研究的数据分析步骤包括对每个受试者的数十亿数据点进行整合。其目标是翻译和理解这些数据,为新的诊断和治疗方法的开发提供信息。
"……我们从基因组数据开始,致力于用基因表达、蛋白质组学、脂质组学、代谢组学和其他组学来填补空白。"
Q:你们为什么要对这些样本进行这么多的测序和组学研究?
SV:我们想要解决遗传性缺失的问题。在2011年我们创办这家公司的时候,有关于心血管疾病的双胞胎研究表明,大约一半的疾病风险是由基因和遗传因素造成的,而另一半则是由环境造成的。1同时我们也了解到疾病相关变异并不能解释5–7%以上的心血管疾病表型。此外,97%的疾病相关SNP并未在外显子(被翻译成蛋白的基因组区域)中发现。2我们开始思考如何才能填补这些空白,找到多因素疾病中的遗传性缺失。
我们意识到,虽然遗传变异可能会增加某人患某种疾病的几率,但它们并不会显示人体内随着时间的推移而正在发生的事情。这就是为什么我们要从基因组数据开始,用基因表达、蛋白质组学、脂质组学、代谢组学和其他组学来填补这个空白。这是我们公司的基本理念。
Q:你们为什么决定要进行如此大规模的临床研究?
SV:我们意识到,如果我们想要以大数据为基础来改变药物和生物标记的发现过程,我们就必须在大型临床研究中证实这种方法。2013年,我们开始招募GLOBAL研究的受试者,这是一项宏大的工作,我们想要收集全球患者群体的样本。我们很清楚,这项研究的规模必须足够大,才具有统计功效,才能获得有用数据。根据我们的计算,样本数应当在6500–7000之间。我们最终在三大洲九个国家/地区的48个临床中心招募了7700–7800名受试者。我们相信,这是针对药物和生物标记的发现而收集多组学数据的最大规模、最全面的前瞻性研究。
Q:8000名受试者的临床试验怎样才能具有检测变异关联所必需的统计功效?
SV:我们将几个组学的测量数据进行了分层,来了解每个变异的功能性含义。检测关联需要一定的统计功效,而由于这些生物通路互相重叠,因此我们能实现减少统计功效所需的受试者数量。
Q:该临床研究的现状如何?
SV:我们在2014年年中完成了GLOBAL临床研究的招募。我们已经对数千人的每个基因进行了测序,并测量了同一受试者的数十万个中间生物标记。我们拥有所有的原始数据、图像和血样,组学分析已经进行了一半。从理论上讲,只要我们拥有相关的表型信息,我们就能验证任何疾病的任何靶点。在接下来的几年里,我们将针对我们感兴趣的常见慢性疾病,仔细研究这些数据然后确定靶点。
"贝叶斯分析揭示出了泛组学层级网络,这些网络汇聚在同一生物通路上……基因变异驱动该网络,随后是RNA和蛋白质网络。"
Q:你们要分析多少个数据点?
SV:在成像方面,我们进行了使用和不使用造影剂的胸部、心脏和上腹部CAT扫描。我们对每个血样进行了全基因组测序(WGS),使用RNA-Seq和microRNA分析评估了转录事件,并使用DNA甲基化分析研究了表观遗传学。我们还进行了蛋白质组学、脂质组学和代谢组学研究来评估小分子。它为试验中的每个受试者增添了数十亿个数据点(图1)。
Q:考虑到对每个血样所进行的分析数量,您如何确保数据质量?
SV:从一开始,我们就认为收集阶段对于确保数据质量非常重要。我们在处理这些样本时非常小心。抽血后将血液离心并分成47份,并且在采血后70分钟内进行冷藏。我们将每一份血液分成A和B两个样本,然后在不同的日期,用不同的卡车或飞机将其运往不同的州,以便进行灾难恢复。
当生物库中有血液样本时,我们会将其交给一流的服务提供商,进行不同的组学分析,包括针对WGS的Illumina Sequencing Services,以及针对RNA-Seq、miRNA-Seq、DNA甲基化、蛋白、脂质和小分子/代谢物分析的IQVIA表达分析。
Q:你们进行了哪些科学观测?
SV:我们已经进行了大量的科学观测,但从最高层次来看,我们有两个主要见解。第一个揭示了功能融合,验证了我们的理念。在一项早期分析中,我们从数百名患者中获得了一万亿个数据点,并以此来寻找导致心血管疾病、非酒精性脂肪性肝炎(NASH)和骨质疏松的通路。贝叶斯分析发现了汇聚到同一生物学通路上的分层泛组学网络。正如我们根据生物学原理所预期的那样,它们以基因变异驱动泛组学网络,而后是RNA和蛋白网络。我们还重新发现了已知的通路,包括LDL通路,这是最著名的心血管疾病通路之一。
我们的第二个观测结果比较模糊。我们查看了整个基因组,寻找了每个疾病状态下每个组学数据集中的最佳匹配或最密切的关联。我们发现这些匹配并非随机分布于基因组中,而是集中在基因簇里。我们正在以科学的方式确定它们的相关性。
"……从转录组数据中发现了一个潜在的靶点。然后,我们就能使用WGS数据并基于LOF变异对靶点进行遗传验证。"
Q:你们是否已使用泛组学方法鉴定出了具有商业潜力的新靶点?
SV:我们获得了心血管疾病的诊断性生物标记专利。它来源于质谱获得的代谢组学数据。这是一种非常简单的血液测试,可以作为压力测试的初步测试,帮助那些因为胸痛而去看病的人。
我们与一家大型制药公司合作,成功地鉴定出了另一个靶点。我们通过无偏差的贝叶斯网络分析,从转录组数据中发现了一个潜在的靶点。然后,我们就能使用WGS数据并基于功能缺失(LOF)变异对靶点进行遗传验证。我们的制药合作伙伴在体外环境中证实了NASH的靶点。
我们还发现了一条新的生物学通路和心血管疾病与脂肪肝的药物靶点。该通路处于这两种疾病通路的交汇处。我们正在根据这个靶点开发药物。事实上,我们使用泛组学方法重新发现了一些已知的通路,这让我们对这条通路以及我们发现的其他新通路的有效性有了信心。
令人惊奇的是,这些发现仅仅是基于我们最初分析的几千个受试者的数据。我们甚至还没有触及到所有数据的表层。
Q:泛组学方法能给药物开发带来新概念吗?
SV:泛组学方法加快了当前鉴定和验证遗传变异的时间密集型和成本密集型过程。例如,GWAS鉴定出了与冠状动脉钙化(CAD)风险增加相关的9p21染色体位点。3而人们花了近15年的时间才了解这些变异的功能。心血管疾病的最新疗法之一是靶向PCSK9蛋白酶。最初人们花了很多年,约对7000–9000名患者进行了观察,才鉴定出该靶点。
我们的方法从两个方面加快了对变异的功能性结果的鉴定。首先,我们会使用WGS研来究每个变异。基因分型依赖先前鉴定出的变异,与之相反,我们使用WGS发现的变异则是基于我们自己的数据集中病例和对照的差异。我们不会因为之前的研究而产生偏差。事实上,我们通过这种方式为一些新靶点鉴定出了一些重要的变异。
其次,我们正在进行一些组学测量,来了解该变异的功能性含义。我们引入了组学数量性状基因位点(oQTL)的概念,在这个概念中我们会对单个变异的基因表达、microRNA、蛋白、脂质和代谢物进行定量分析。有了这些数据,我们可以从数百个患者中获得同样的见解。例如,我们收集了不到500例患者的数据,并以高统计学显著性水平完成了验证之后,几个月内就鉴定出了NASH的靶点。
临床研究是药物开发的一项重要金融投资。我们相信,我们的泛组学方法可以减少开发新疗法所需的资金。
"我们相信,与基因分型和全外显子组测序相比,准确的WGS具有更显著的增量价值。"
Q:在泛组学方法中,WGS的价值是什么?
SV:我们主要使用WGS来验证遗传靶点。然而,我们也经常能够从蛋白质组学或基因表达研究产生的功能性非DNA数据中鉴定出潜在的靶点。为了证实这些靶点,我们会查看WGS数据,并研究编码这种蛋白或受体的基因。然后,我们就能鉴定出该基因中的变异,并查找与该疾病的生物标记和表型相关的LOF变异。我们使用了这种方法来鉴定NASH的靶点。
Q:你们如何选择组学分析合作伙伴?
SV:在创立G3时,我们有两种选择。一种是购买所有的设备,在我们自己的实验室进行组学测量,另一种是将所有业务外包给一流的供应商。在完成尽职调查后,答案很明显,我们应该外包。
我们选择了Illumina FastTrack Sequencing Services作为我们的WGS服务提供商。在之前的学术生涯中,我使用过iScan系统和Infinium基因分型芯片来进行心血管疾病的GWAS。我知道Illumina的产品可靠又准确,而且该公司会提供良好的支持。我们相信,与基因分型和全外显子组测序相比,准确的WGS具有更显著的增量价值。
在创立G3之前,我曾成功地使用过IQVIA表达分析。我们选择了该公司来进行其他组学研究,其中一些研究使用的也是Illumina的产品。例如,RNA-Seq和microRNA-Seq表达分析在HiSeq 4000系统上进行,DNA甲基化分析在Human Methylation 450K BeadChip上进行。
"泛组学方法加快了当前鉴定和验证遗传变异的时间密集型和成本密集型过程。"
Q:G3的后续计划是什么?
SV:我们非常期待未来几年的变化。仅仅7年的时间,我们的血液检测就进入了市场,一些药物靶点也正在研发中。如今我们已经证明了泛组学方法在心血管、心脏代谢和肝脏疾病中的价值,我们希望以后能将其应用于其他疾病。人们对阿茨海默病特别感兴趣。这是一种常见的多因素、多基因慢性疾病,需要结合我们的泛组学方法进行定量且精确的基因分型。我们正在寻找合作伙伴来共同研究阿茨海默病和其他痴呆症。我们想采用同样的方法,将其应用于神经退行性疾病和肌肉骨骼疾病。最后,我们还想启动肿瘤学项目。
Q:G3的方法会对医疗保健带来怎样的影响?
SV:20世纪90年代和21世纪初是一个以群体为基础、以指南为导向进行用药的时代。我们希望我们的方法能推动其转变为采用以分子图谱为导向的个性化方法。我们的设想是,在未来,当医生走进诊疗室时,我们的方法可以让他们检测病人的相关图谱和分子指纹,并为坐在对面的患者开出个性化的治疗方案。
深入了解G3如何把所有组学结合在一起:
深入了解本文提及的服务、系统和产品:
Illumina FastTrack Sequencing Services
参考文献
- Marenberg ME, Risch N, Berkman LF, et al.Genetic susceptibility to death from coronary heart disease in a study of twins.N Engl J Med.1994; 330:1041-1046.
- Maurano MT, Humbert R, Rynes E, et al.Systematic localization of common disease-associated variation in regulatory DNA.Science.2012; 337:1190-1195.
- McPherson R, Pertsemlidis A, Kavaslar N, et al.A common allele on chromosome 9 associated with coronary heart disease.Science.2007;316:1488-1491.