可扩展的高通量芯片可开发中国人基因组数据库
简介
没有两个人的基因是完全相同的,无论他们来自同一个地区、同一个种族还是同一个家庭。对人类基因组进行测序有助于我们理解遗传学在人类疾病中的作用,以及环境、饮食和行为对人类健康遗传学的影响。它还可以揭示不同种族之间独特的基因差异。微基因(WeGene)是一家个人基因检测和群体基因组学公司,总部位于中国深圳。该公司通过了解东亚人群体、特别是中国各种族之间的基因差异并利用这一价值来获取利润。除了为客户提供基因检测服务外,该公司还在创建东亚人基因组数据库,用于支持全球研究中心的人类基因组研究和个性化医疗方法的开发。
自2015年成立以来,微基因的个人基因检测服务迅速发展,获得的数据使其东亚人数据库初具规模。该数据库包含20多万份客户数据,其中大部分数据来自中国人样本。为了让中国客户更好地了解他们独特的遗传图谱和完整的祖源分析,微基因正在扩大数据库,纳入更多的中国种族群。预计该数据库将以每个月15,000多份数据的速度增长,因为该公司改用Infinium Global Screening Array和iScan™系统解决方案,可以实现更高的通量和更广泛的基因组覆盖。为了扩大实验室的规模并提高工作流程效率,微基因与Illumina ArrayLab服务开展了合作。
iCommunity采访了首席执行官郑强和首席技术官陈钢博士,讨论了微基因的个人基因检测服务的迅速发展,中国种族数据库的价值的日益增长,以及新一代测序(NGS)在未来基因检测产品和服务的开发中将发挥的作用。
微基因位于中国深圳,郑强是首席执行官,陈钢博士是首席技术官。
问:微基因的重点和使命是什么?
郑强:作为东亚地区最成功的个人基因检测公司之一,微基因通过在线渠道营销和特殊活动为客户提供直接面向消费者(DTC)的检测服务。我们的使命是利用我们通过检测服务收集到的遗传数据,特别是针对中国种族群体,为人类健康、疾病研究和药物开发带来新的曙光。
问:中国DTC基因检测市场的现状如何?
郑强:中国的DTC市场正在蓬勃发展。虽然进行基因检测的人口比例仍然很小,但是消费者的兴趣正在迅速增长。许多公司也看到这种服务的潜力,并进入了市场。
问:微基因提供哪些类型的检测服务?
郑强:我们以数据为支持、以科学为基础为客户提供祖源遗传评估以及过敏健康筛查等。我们结合DNA和表型数据,对这些数据进行深入挖掘和研究。每个客户都会收到一份报告,其中概述了科学依据、研究结果和相应的研究方法。综合所有信息,我们审查得出结果,确定这些信息对客户有用程度。
客户提供的生活方式、表型和基因型数据构成了我们不断增长的基因组数据库的基础,我们的数据库覆盖了中国所有56个种族群和其他几个东亚人群体。我们的目标是为这些亚洲人群体建立最大的基因组数据库。所以我们与各个科研机构合作,使我们的中国客户能够参与到各种基因组相关的研究中来。
“微基因开发中国种族和东亚人基因组数据库的目标是推动基因检测技术的应用和研究,造福个人消费者和全球的研究机构。”
问:为什么创建中国种族基因组数据库如此重要?
陈钢:基因组技术对许多健康和医学研究领域产生了重大影响。但是目前大部分的基因组数据并非来自东亚人群体,比如中国种族群。不同人群的基因组之间存在巨大的差异,这会影响我们对这些人群中的疾病表现、病程和预后的理解。所以积累中国人甚至东亚人群体的基因组数据并创建参考基因组,对于开发成功的个性化治疗方法和诊断检测至关重要。
问:您是如何创建这个数据库的?
陈钢:我们认为在收集遗传数据时,与客户直接互动是很重要的。只包含基因组数据的数据库的价值是有限的。通过与中国客户直接沟通,我们可以收集遗传数据、表型数据和行为数据,用来构建更全面的数据库。我们相信,这种类型的数据库对于推动中国人群体的基因组研究是最有价值的。我们希望快速扩大基因组数据库的规模,为中国人甚至东亚人群体的基因研究和应用开发奠定基础。
问:您使用了哪些工具和方法来获得这些数据库的遗传数据?
陈钢:我们使用经FDA批准的唾液取样器,确保采集、运输和储存的质量。我们采用高通量芯片平台进行基因检测,并且通过进行数据质量控制和归因分析产生高质量的遗传数据,为东亚人和中国种族参考基因组提供信息。
问:您之前用来创建这些数据库的方法和系统有哪些局限性?
郑强:在公司成立初期,我们的检测量小,增长速度也慢。我们考虑了各种解决方案,包括Illumina Infinium BeadChip和Affymetrix芯片。最终我们选择了Affymetrix。
问:是什么促使您改用芯片解决方案?
郑强:经过两年的发展,我们的样本量有了显著的增加。我们在快速处理这么大数量的样本时遇到了生产问题。我们需要一个更高效的生产平台来提供更快的速度和更高的数据质量。
“基于效率、质量和服务方面的考虑,我们选择了Illumina芯片解决方案。”
问:您为什么选择Illumina芯片解决方案?
郑强:我们测试和评估了几种基因检测解决方案。根据我们对样本量的预测、对中国DTC检测市场增长的估量以及对数据的要求,具有更高性能的基于芯片的平台是我们的最佳的选择。有两家供应商的解决方案满足我们的条件,一个是Illumina的芯片解决方案,它包括Infinium Global Screening Array(GSA)和iScan系统,另一个是另一家供应商的芯片解决方案。
在最终的评估中,我们参考了一些国外的经验,其中包括23andMe的经验,并研究了与配件有关的问题。我们的结论是,Illumina芯片解决方案非常稳定,拥有庞大的全球用户群,并提供出色的技术支持。它能够解决由于样本检测量快速增长而加剧的生产积压、质量和效率问题。基于效率、质量和服务方面的考虑,我们选择了Illumina芯片解决方案。
问:改用Illumina工作流程后样本处理能力是否增加?
郑强:使用Illumina芯片解决方案后,我们的样本周转时间从7个工作日缩短至3个工作日。效率提高非常显著,使我们的样本处理速度从每周不到2000个增加到每周15,000个。这大大提高了处理能力。
问:使用Tecan液体处理解决方案使Illumina芯片工作流程自动化是一个优势吗?
郑强:使芯片工作流程自动化是我最重视的Illumina芯片解决方案的优势之一。因为自动化对于未来处理大量样本是至关重要的。
问:使用Illumina芯片解决方案,您获得的数据质量水平如何?
陈钢:我们与Illumina的研究团队、开发团队和生产团队合作,添加了某些标记,创建了各种定制的GSA来满足我们的需求。即使我们要求包含许多额外的定制标记,Illumina合成的这些芯片仍然非常出色。这些定制GSA的稳定性、相关性很好,数据质量也很高。
“使用Illumina芯片解决方案后,我们的样本周转时间从7个工作日缩短至3个工作日。”
问:使用GSA进行基因检测的优势是什么?
陈钢:微基因参与了早期GSA设计的讨论。自从Broad研究所提出最初的设计方案以来,我们看到了GSA在芯片设计理念和设计基础方面处于领先地位。
GSA广泛应用于国内外许多商业和科研机构,积累了大量的数据。在可预见的将来,这种数据积累的规模和速度会持续增长。这对于微基因创建数据库是非常显著的优势,因为提供的数据与未来全球研究数据兼容。在消费者和科学研究中使用基于GSA的芯片可以使微基因获得更好的结果,让我们有更多的机会来鉴定与疾病和健康相关的种族特异性标记。
Illumina芯片解决方案生成的高质量数据也为我们的客户提供了价值。其他Infinium个人基因组产品,比如23andMe DTC检测的部分产品,已在美国获得监管批准。使用Infinium GSA和iScan系统进行个人基因组检测所获得的结果将有助于我们在中国和其他地区获得监管批准。Illumina芯片解决方案为客户提供了值得信赖的可靠DTC基因检测。
问:您开始使用Illumina Asian Sequencing Array(ASA)了吗?
陈钢:我们还没有开始使用ASA。我们将与Illumina合作创建针对中国种族的定制ASA芯片,用来支持微基因未来基因检测产品的开发。
问:Illumina ArrayLab咨询服务在建立新的实验室工作流程方面有哪些好处?
郑强:Illumina ArrayLab咨询团队在规划和设计大规模生产实验室操作方面有丰富的经验。他们协助我们完成了设施的设计,确定了有效工作流程所需的系统数量。在耗材方面,我们一起创建了一份生产芯片出货时间表,可支持我们不断增加的样本量。ArrayLab团队还帮助我们确定了可扩展高性能实验室所需的人员配置和外部资源预测,以及自动化和过程控制的需求。在整个构建和开发过程中,如果一切都由我们自己来协调,我们可能会遇到很多问题,而该团队的经验和指导使我们避开了这些潜在的问题。ArrayLab咨询服务团队让我们能够在建立的成熟模型上更快、更有效地运行实验室。
问:您使用什么软件流程进行数据分析?
郑强:Illumina协助我们设计了一个高通量分析软件流程。我们对Illumina提供的标准数据分析流程进行了优化,使其更适合我们的大规模基因组数据工厂。我们需要大量的计算节点来有效处理生成的数据。因此我们还开发了几个云组件来分析和解读数据。
“ArrayLab咨询服务团队让我们能够在建立的成熟模型上更快、更有效地运行实验室。”
问:您是否有评估NGS在基因检测方面的发展,计划扩大DTC产品的供应?
陈钢:微基因致力于为客户提供最新的基因检测技术和最佳的检测方法。为了获得全面的个人基因组数据,我们需要对整个基因组进行测序。利用NGS、特别是全基因组测序(WGS)来开发新的基因检测产品,能为客户提供更好、信息更丰富的个人基因组检测和分析服务。因为WGS分析的是整个基因组而不是单个基因,所以它可以更深入地评估遗传变异。
我们在WGS试点研究中使用最新的测序系统,包括NovaSeq™ 6000系统。通过与全球不同机构的学术研究团队合作,我们正在对数千个客户的全基因组序列进行数据分析和管理。
试点研究的测序结果令人印象深刻。WGS提供的信息比芯片多得多。我们为参与研究的客户提供WGS VCF文件,他们可以交给第三方数据分析公司进行分析。例如,有些服务可以提供基于Y染色体的数据分析结果。除了原始测序数据,我们还包括可以用来确定细胞年龄的端粒长度数据,以及其他相关的分析结果。
我们试点研究的WGS数据将用于进一步开发定制的个人基因组芯片,用于亚洲人群体的基因检测。结合芯片归因和质量控制数据,我们可以进一步改进定制芯片。
问:NovaSeq 6000系统在这些研究中表现如何?
陈钢:NovaSeq 6000系统是世界领先的测序平台之一,提供了极其出色的性能、数据质量和稳定性。
问:NGS对您的DTC业务产生了哪些积极影响?
陈钢:随着技术的进步和测序成本的降低,我们相信NGS最终会成为个人基因组检测的主流技术。这就是我们现在进行必要的研究和开发,提高我们的NGS技术能力的原因。我们研究得到的NGS数据有利于中国种族甚至东亚人数据库的开发,改善我们基于GSA的服务,并为新一代的微基因个人基因组检测服务奠定基础。我们将继续与不同研究领域的科学家进行深入研究,挖掘NGS全基因组测序数据的优势。
“随着技术的进步和测序成本的降低,我们相信NGS最终会成为个人基因组检测的主流检测技术。”
问:NGS数据对数据库的进一步开发有什么帮助?
陈钢:微基因开发中国种族和东亚人基因组数据库的目标是推动基因检测技术的应用和研究,造福个人消费者和全球的研究机构。NGS技术有助于检测整个基因组,为我们提供详细的遗传信息,比如结构变异、拷贝数变异和罕见突变的存在。这些数据对于研究癌症、自闭症和罕见病的学术研究人员非常有价值。
我们坚信,如果在个人基因组产品中全面、大规模地使用NGS技术,我们就可以迅速使这些学术领域的研究成果造福于个人消费者。反过来,个人消费者的数据也会促进基因组数据库的研究。
问:微基因拓展DTC业务的下一步计划是什么?
郑强:我们希望迅速扩大我们的用户群。据预测,我们将在2019年达到100万用户,五年内超过2000万用户。我们将继续在中国、东亚甚至全球推广和培育微基因服务的潜在客户。我们将继续寻求研究合作关系,提高客户基因检测服务以及中国种族和东亚人基因组数据库的价值和效用。
问:Illumina的产品、系统和服务为这些目标提供哪些支持?
郑强:Illumina的产品、系统和服务有助于降低成本,提高检测效率,并通过智能自动化系统实现更高的生产效率,从而扩展我们的生产和分析服务。