优化快速全基因组测序流程,实现更出色的速度、重复性和可扩展性

Chris Kunard和Kevin Hall

简介

遗传疾病是儿科死亡的主要原因,尤其是新生儿重症监护病房(NICU)收治的婴儿 1,2。约40%的新生儿死亡与罕见遗传疾病相关1-5。由于患有遗传病的儿童疾病进展极快,因此快速确定致病遗传变异至关重要。快速诊断有助于及时进行治疗干预,从而避免这一弱势患者群体出现严重的发病率和死亡率6。使用标准基因组测序技术进行诊断可能需要长达数周的时间,并且需要医疗提供者进行解释并作出管理决策。如果诊断和开始治疗的时间延迟,可能导致一些患有罕见遗传病的急症患者预后较差。

快速全基因组测序(rWGS)是标准基因组测序的替代方法,能够在50小时内对危重婴幼儿的罕见遗传病做出快速准确的诊断7。临床研究显示,rWGS对于高达57%的病例实现了阳性诊断8,对于ICU收治的儿童患者,30%-72%的患者获得了更明智的医疗管理7-13 。然而,由于缺乏可扩展性且无法应对复杂的结构变异问题(这类变异占ICU儿童遗传疾病诊断的20%),rWGS的临床应用十分受限14

本文介绍了我们参与研究和开发的经过重新设计的全新基因组测序工作流程,旨在提高速度、改善重复性和可扩展性,实现13.5小时的rWGS。该流程由我们与Rady儿童基因组医学研究所共同开发,采用因美纳新一代测序(NGS)技术,通过优化文库制备、测序和变异检出,消除了常规rWGS工作流程中的关键瓶颈,能够快速准确地鉴别遗传变异,包括复杂的结构变异。

经过优化的13.5小时的基因组测序工作流程

在之前的工作中,我们报告了一种能够在20小时内正确识别致病遗传变异的rWGS流程9。尽管该方法前景良好,但缺乏可扩展性,而且无法充分捕获结构变异。在这篇文章中,我们介绍了对rWGS工作流程的优化创新,以改善可扩展性、周转时间,以及对拷贝数变异(CNV)和结构变异(SV)的分析性能(图1)。 

图1.快速全基因组测序(rWGS)工作流程在13.5小时内鉴定变异。

VC,变体检出;SV,结构变体;TSS,TruSight软件套装;GEM,Fabric GEM基因组解析平台;MOON,Invitae变异解读软件。*660分钟是指使用定制的运行方案并尽可能缩短循环时间。

使用Illumina DNA PCR-Free Prep加速文库制备

rWGS样品制备面临的一项关键挑战是从少量样品中纯化出高质量基因组DNA。我们直接使用乙二胺四乙酸(EDTA)血样或来自Nucleic Card Matrix干血斑(Thermo Fisher,货号4473977)的5个3 mm血片制备测序文库,这些都是新生儿强制性筛查中经常使用的样本类型。使用Illumina DNA PCR-Free Prep, Tagmentation进行文库制备,该产品采用磁珠固化转座酶确保大小一致的插入片段,同时减少手动操作时间。采用磁珠固化转座酶,无需中间DNA纯化步骤,同时仍能鉴定CNV和SV。大幅缩短了孵育时间,实现文库输出的标准化。因此可以使用文库定量试剂盒(KAPA Biosystems,货号:KK4824-079601666001)对文库浓度进行快速测量。总体而言,使用纯化的基因组DNA样本,平均45分钟可完成文库制备,使用血液样本,平均72分钟完成文库制备。


使用NovaSeq™ 6000测序仪开展高效测序

使用NovaSeq 6000测序仪对制备的文库进行测序,采用2 × 101 bp循环,SP流动槽和1.5版试剂,以实现高质量测序输出。对流动槽的两个通道进行单面成像。我们采用了定制的运行方案,并尽可能缩短了循环时间,从而保证了序列质量。在覆盖度超过40x时,测序产量约为150 Gb,Phred质量评分超过30(Q30)的read占比为87%(表1)。测序运行的平均时间为11小时12分钟。

表1.13.5小时rWGS方法针对单个测试样本的序列指标汇总


采用Dynamic Read Analysis for GENomics(DRAGEN™ v.3.7)实现更快的序列比对和变异检出

使用速度、灵敏度和准确性经过高度优化的Illumina DRAGEN平台进行序列比对和变异检出。文件从NovaSeq 6000基因测序仪自动传输到DRAGEN平台。将序列与人类基因组组装GRCh37(hg19)比对,使用DRAGEN平台v.3.7.5鉴别变异并进行基因分型。变异检出文件自动发送至变异解读软件,包括Illumina TruSight™软件套装和第三方软件、MOON(Invitae)和GEM(Fabric Genomics)。在三个软件平台上并行运行三级分析。应用决策树、贝叶斯模型、神经网络和自然语言处理对变异进行连续过滤和排序,生成输出结果用于变异鉴定。

使用两个参考DNA样本(NA12878和NA24385)评估改进的rWGS流程的分析性能。这些参考样本包含由美国国家标准与技术研究所(NIST)针对SNV和插入缺失(indel)(NISTv4.1)以及SV和CNV(NISTv0.6)制定的金标准变异集。使用Witty.Er计算CNV和SV检测的分析性能。从DNA样本制备到完成变异检出的平均用时为12小时42分钟,与之前使用DRAGEN v3.5.3的基准相比提高了35%(图2)。 

图2.rWGS工作流程关键步骤的优化显著提高了速度。

上图:使用13小时rWGS(蓝色)和标准rWGS(橙色)方法,完成三个测试样本检测的总时间。下图:13.5小时rWGS流程和标准rWGS流程每个步骤花费的平均时间。

DRAGEN v.3.7在结构变异检测方面的卓越分析性能

将DRAGEN v.3.7的性能与Manta和CNVnator进行了比较,后两者是检测SV(大小 > 50 nt)和CNV(大小 > 10 kb)的常用工具。DRAGEN v.3.7在检测插入SV(DRAGEN 49% vs Manta 27%)和缺失CNV(DRAGEN 88% vs CNVnator 9%)方面具有更出色的灵敏度(表2)。使用DRAGEN v.3.7时,一级和二级分析(包括原始数据从碱基检出转换为FASTQ格式、与参考基因组比对和变异检出)的平均时间仅为47分钟,而使用Manta和CNVnator时需要3小时9分钟,分析时间大幅缩短。

表2.DRAGEN v.3.7与Manta和CNVnator在结构变异检测方面的分析性能比较。

使用DRAGEN v.3.7和Manta/CNVnator处理参考样本NA24385,与NIST基准相比,CNV缺失检测的准确度和检出率显著提高。SNV:单核苷酸位点变异;indel:插入/缺失;SV:结构变异(大小 > 50 bp);CNV:拷贝数变异(大小 > 10 kb)。

13.5小时rWGS流程的潜在应用

13.5小时rWGS流程对7份测试样本中的6份实现了准确的遗传变异鉴定。使用我们的rWGS工作流程,可在14小时内实现所有样本的致病遗传变异鉴定,而使用标准rWGS则平均需要42小时。最快完成时间为13小时13分钟。我们的rWGS工作流程集速度、重复性和可扩展性于一体,适用于各种高通量应用。

总结

在本文中,我们概述了一种重新设计的rWGS流程,该流程经过优化,能够快速、准确地鉴定测试样本中的致病遗传变异。rWGS工作流程中的关键步骤,包括加速文库制备和NovaSeq 6000基因测序仪的高性能测序,结合能够快速准确地进行变异检出的DRAGEN v.3.7,使得rWGS能够在13.5小时内完成检测。除了测序速度大幅提升以及与第三方变异解读工具兼容之外,该rWGS流程使研究人员能够快速准确地检测变异(包括结构变异)。 

参考文献

1.      Gunne E, McGarvey C, Hamilton K, Treacy E, Lambert DM, Lynch SA. A retrospective review of the contribution of rare diseases to paediatric mortality in Ireland. Orphanet J Rare Dis. 2020;15(1):311. doi:10.1186/s13023-020-01574-7Weiner

2.      Weiner J, Sharma J, Lantos J, Kilbride H. How infants die in the neonatal intensive care unit: trends from 1999 through 2008. Arch Pediatr Adolesc Med. 2011;165(7):630-634. doi:10.1001/archpediatrics.2011.102

3.      Murphy SL, Xu J, Kochanek KD, Arias E. Mortality in the United States, 2017. NCHS Data Brief. 2018(328):1-8.

4.      Arth AC, Tinker SC, Simeone RM, Ailes EC, Cragan JD, Grosse SD. Inpatient Hospitalization Costs Associated with Birth Defects Among Persons of All Ages - United States, 2013. MMWR Morb Mortal Wkly Rep. 2017;66(2):41-46.

5.      Berry MA, Shah PS, Brouillette RT, Hellmann J. Predictors of mortality and length of stay for neonates admitted to children's hospital neonatal intensive care units. J Perinatol. 2008;28(4):297-302.

6.      Petrikin JE, Cakici JA, Clark MM, et al. The NSIGHT1-randomized controlled trial: rapid whole-genome sequencing for accelerated etiologic diagnosis in critically ill infants. NPJ Genom Med. 2018;3:6. doi:10.1038/s41525-018-0045-8

7.      Saunders CJ, Miller NA, Soden SE, et al. Rapid whole-genome sequencing for genetic disease diagnosis in neonatal intensive care units. Sci Transl Med. 2012;4(154):154ra135. doi:10.1126/scitranslmed.3004041

8.      Petrikin JE, Willig LK, Smith LD, Kingsmore SF. Rapid whole genome sequencing and precision neonatology. Semin Perinatol. 2015;39(8):623-631. doi:10.1053/j.semperi.2015.09.009Farnaes

9.      Clark MM, Hildreth A, Batalov S, et al. Diagnosis of genetic diseases in seriously ill children by rapid whole-genome sequencing and automated phenotyping and interpretation. Sci Transl Med. 2019;11(489):eaat6177. doi:10.1126/scitranslmed.aat6177

10.   Kingsmore SF, Cakici JA, Clark MM, et al. A Randomized, Controlled Trial of the Analytic and Diagnostic Performance of Singleton and Trio, Rapid Genome and Exome Sequencing in Ill Infants. Am J Hum Genet. 2019;105(4):719-733. doi:10.1016/j.ajhg.2019.08.009

11.   Farnaes L, Hildreth A, Sweeney NM, et al. Rapid whole-genome sequencing decreases infant morbidity and cost of hospitalization. NPJ Genom Med. 2018;3:10. doi:10.1038/s41525-018-0049-4

12.   Willig LK, Petrikin JE, Smith LD, et al. Whole-genome sequencing for identification of Mendelian disorders in critically ill infants: a retrospective analysis of diagnostic and clinical findings. Lancet Respir Med. 2015;3(5):377-387. doi:10.1016/S2213-2600(15)00139-3

13.   Sanford EF, Clark MM, Farnaes L, et al. Rapid Whole Genome Sequencing Has Clinical Utility in Children in the PICU. Pediatr Crit Care Med. 2019;20(11):1007-1020. doi:10.1097/PCC.0000000000002056

14.   Maron JL, Kingsmore SF, Wigby K, et al. Novel Variant Findings and Challenges Associated With the Clinical Integration of Genomic Testing: An Interim Report of the Genomic Medicine for Ill Neonates and Infants (GEMINI) Study. JAMA Pediatr. 2021;175(5):e205906. doi:10.1001/jamapediatrics.2020.5906