揭示长链非编码RNA在癌症中的作用
简介
Jo Vandesompele教授(PhD)对RNA非常感兴趣。这一切开始于他的博士论文研究,当时他使用了逆转录酶定量PCR(RT-qPCR)来研究RNA在神经母细胞瘤中的作用。从那以后,他就迷上了RNA。这个领域是他在根特大学的功能性癌症基因组学团队的研究重点,也是他在2007年创办的公司Biogazelle的业务重点,该公司提供RNA分析和实验设计服务。
“我认为RNA是一种非常有趣的分子,”Vandesompele教授说道。自从在一次会议上听到关于长链非编码RNA(lncRNA)的介绍后,他就开始高度关注这一特殊类型的RNA。人们认为lncRNA与人体中很多特化细胞的形成有关,并能调控细胞的转录组织方式。某些癌细胞似乎依赖于特定lncRNA的存在,当该转录本被沉默时,它们就会死亡。“我们立即意识到了lncRNA的强大功能,开始使用不同的文库制备方法来研究这些转录本及其在各种癌症中的功能,”Vandesompele教授补充道。“我们在根特大学和Biogazelle的团队是全世界公认的lncRNA专家。”
iCommunity采访了Vandesompele教授,探讨了与只关注DNA标记相比,lncRNA对了解癌症的价值,以及如何将它们作为靶点来开发新的癌症诊断方法和治疗方法。我们还了解了他们如使用NextSeq™ 500系统和TruSeq™ RNA Exome来鉴定高度片段化的样本中的RNA标记,例如福尔马林固定石蜡包埋(FFPE)组织样本和液体活检。
Jo Vandesompele博士是根特大学的教授,也是Biogazelle的联合创始人兼首席科学官。
Q:您对RNA特别是lncRNA的兴趣因何而起?
Jo Vandesompele(JV):我在研究生院进行神经母细胞瘤研究时,对RNA产生了兴趣。我想要了解原始细胞,它们是罕见的细胞。Northern blot和芯片需要的RNA量太大,因此我使用了RT-qPCR,这在当时是一种新的方法。
我参加了2009年的Keystone研讨会,在那里,我第一次了解到了lncRNA。在当时,已经鉴定出来的lncRNA序列大约只有1700个。我们意识到了lncRNA作为生物标记的强大功能,并设计了qPCR检测来对它们进行定量。经过我们和全世界研究人员的努力,lncRNA数据库增加到4000条序列,后来又增加到18000条序列。
Q:你们使用过哪些技术来研究lncRNA?
JV:很明显,随着lncRNA数据库的增长,qPCR不再是高效的检测方法。我们设计了芯片,然后开始使用不同的文库制备方法来进行总RNA-Seq。当时开展总RNA-Seq的研究人员很少,现在也不多。大部分研究人员依赖于polyA RNA-Seq,而这种方法只能捕获带有polyA尾的RNA。据我们估计,大约一半lncRNA没有polyA尾。
Q:lncRNA在人体中的功能是什么?
JV:有关lncRNA在人体中的功能,我们只了解到了一些表面的东西。随着实验的进行,出现的主题之一是lncRNA极高的组织和细胞类型特异性。lncRNA似乎可以解释人类生命的复杂性。虽然苍蝇、番茄和人类的差别很大,但他们却具有几乎相同数量的蛋白编码基因。然而人类要复杂得多,全身遍布着许多特化的细胞类型。研究人员曾认为这是由于选择性剪接或翻译后蛋白质修饰所致。在某种程度上,这是正确的。然而,从转录调控的角度来看,lncRNA在调控细胞组织形式中发挥了重要作用,这一点已经很清楚了。我们认为lncRNA的作用就像胶水,能粘合蛋白质与DNA或蛋白质与RNA,还能将不同的RNA分子粘到一起,形成一个框架。另一种可能性是它们会与重要的分子结合,将其带离不应出现的位置,带到应该出现的位置。
"lncRNA的表达特异性可以用来揭示细胞的状态。"
Q:lncRNA能告诉我们哪些关于细胞状态的信息?
JV:lncRNA的表达特异性可以用来揭示细胞的状态。到目前为止,已经鉴定出来的lncRNA大约有50,000个,这个数字还在不断增长。lncRNA表达的时空特异性非常高,只会在特定的细胞类型中表达一小部分。一旦我们弄清楚了特定lncRNA表达的时空特征,我们就可以鉴定细胞类型和细胞状态,例如它是健康的还是患病的。通过研究这些细胞类型的特异性,我们可以了解很多东西。
Q:如何将lncRNA用作诊断和治疗开发的生物标记?
JV:如果lncRNA只在特定的细胞或组织中表达,那么我们就可以合理地假设它在该细胞中具有重要的功能。事实证明,某些细胞(特别是某些癌细胞)非常依赖lncRNA的存在。SAMMSON是我们鉴定的第一批lncRNA之一,它只在皮肤黑素瘤中表达。我们与合作者一起发现了沉默SAMMSON能破坏某些线粒体功能,杀死癌细胞。1
SAMMSON是数百个癌细胞种类特异性的lncRNA之一,如果我们将它除去,癌细胞就会受到影响,会停止增殖或死亡。我们可以针对lncRNA进行合理的药物设计来开发治疗方法和伴随诊断。如果知道lncRNA的序列,我们就可以设计针对它的检测方法,鉴定依赖这些lncRNA的疾病或癌细胞,并用沉默技术让它们不再表达。有研究人员正在开发相应的基于CRISPR和siRNA的方法。反义核苷酸为lncRNA靶向疗法的开发提供了一种最先进的、最有前景的方法。
lncRNA为肿瘤学、神经学和其他疾病领域带来了希望。市场上已经有了几种反义药物,例如inotersen、诺西那生(nusinersen)、依特立生(eteplirsen)和米泊美生(mipomersen),还有100多个正在评估反义寡核苷酸的临床试验。这些药物易于给药,会通过减少RNA或修饰剪接来发挥功能。2我们正在开始使用一种全新的药物。
Q:你们在根特大学进行的是哪种类型的lncRNA研究?
JV:我们最初关注的是儿童癌症,在那个时候,我们意识到这项技术可以应用于所有类型的癌症。我们现在关注的大约有十几种癌症,包括前列腺癌、黑色素瘤、卵巢癌、食道癌、肺癌和神经母细胞瘤。我们正在努力扩大范围,并与专家和关键意见领袖合作,共同推进这些研究。
"大部分研究人员依赖于polyA RNA-Seq,而这种方法只能捕获带有polyA尾的RNA。据我们估计,大约一半lncRNA没有polyA尾。"
Q:Biogazelle的客户群构成是什么样的,你们提供哪些服务?
JV:我们主要与制药、生物技术和临床研究人员合作。我们提供全面的服务,包括通过定制RNA定量研究进行RNA生物标记发现,进行高通量反义寡核苷酸筛选,鉴定、测量和沉默lncRNA靶点,以及帮助客户进行先导药物发现和临床前研究等。
我们提供给客户的不只是数据。我们会帮助他们思考项目,提供有用的观点和结果,以便他们继续进行研究。我们有博士级别的项目经理,他们会参与所有项目讨论并协助进行实验设计。我们会在通过了ISO 17025认证的质量受控的环境中应用我们的方法,可以按照临床实验室质量管理规范(Good Clinical Laboratory Practice, GCLP)的标准开展工作,这对于我们的制药客户非常重要。
我们还有研究部门,这个部门与Illumina有很多合作。该团队致力于开发新的RNA定量方法,帮助客户完成以前不可能完成的工作,特别是在液体活检领域。
Q:你们从何时开始使用Illumina NGS系统?
JV:我们在根特大学使用的第一个NGS系统是Roche 454系统。我们只用它来进行DNA分析。人们抱怨它很难用,而且成本很高。大概在同一时期,我们购买了一台Genome Analyzer™II系统。2014年,我们中心的诊断实验室购买了一台MiSeq™系统。大家对它非常满意,觉得它很好用而且经济实惠。大约同一时期,Biogazelle团队购买了一台NextSeq 500系统来进行RNA-Seq。在那之后,我们又购买了第二台NextSeq 500系统。
Q:你们分析的样本类型有哪些?
JV:我们分析的样本大部分是高度片段化的癌症样本,例如FFPE组织样本和液体活检样本。3TruSeq RNA Exome解决方案非常适合处理起始量超低且RNA高度片段化的FFPE和液体活检样本。它能将总RNA转变为已知链起源的模板分子,然后进行编码RNA的序列捕获。其他总RNA制备方法会在不一定有意义的内含子上消耗很多read,而且生成的数据质量也较低。
Q:处理样本后,你们如何确定是否获得了足够的数据?
JV:我们会在每个步骤结束后进行质量控制(QC)。收到样本后,我们会查看样本的体积,确保它与客户在标签上所述的一致。如果是FFPE样本,我们会对其纯度和完整性进行定量。但如果是液体活检样本,由于其水平太低,我们无法一开始就分析完整性或纯度。我们只有在片段分析仪上使用预捕获cDNA检查预纯化文库时,才能首次确认液体活检样本的这些信息。这些信息可以使用任何微流体设备来进行评估,在90%以上的情况下都可以获得结果。有时候我们需要进行重复分析,因此我们会尽可能确保我们有足够的RNA。
在富集和文库纯化后,我们会再进行一次浓度QC以确保进行等摩尔混合。这些QC步骤通过后,我们才会在NextSeq 500系统上进行RNA-Seq并获得高质量的数据。
生成高质量的数据极为重要。很多服务提供商没有认识到测序存在批次效应。我们发现,打乱并随机化样本能避免批次效应。客户发送给我们的样本总是有特定的顺序。因此,我们在收到样本后、提取期间以及文库制备期间都会将样本随机化,以此来消除批次效应。我们还会使用质量控制试剂和批次控制试剂来防止批次效应的引入。在测序方面,我们也会尝试增加标签数量来获得尽可能多的样本。我们所有的文库几乎都有多达96个标签,某些应用(例如3’末端测序)的标签甚至更多。
"如果知道lncRNA的序列,我们就可以设计针对它的检测方法,鉴定依赖这些lncRNA的疾病或癌细胞,并用沉默技术让它们不再表达。"
Q:您会使用RNA-Seq来鉴定样本中的突变吗?
JV:我们想鉴定癌症样本中的突变,以及剪接变异和基因融合,但很多人很保守,只想让我们进行基因水平的定量。
这有点遗憾,他们没有充分利用丰富的RNA-Seq数据。例如检测选择性剪接是很容易的。另外,现在还有一种源自反向剪接的新型剪接,称为环状RNA(circRNA)。最近有3篇文献报道了circRNA作为药物作用靶点或新生物标记的潜力。4-6 CircRNA没有polyA尾,不能用经典的polyA测序鉴定,这可能是人们之前没有注意到它们的原因。
我们正在推动这一技术,看看能否在RNA-Seq数据中鉴定出其他突变。客户理解DNA层面的价值。但在RNA层面上,则完全是另一回事。例如,RNA编辑是一种令人困惑但有趣的现象。我认为我们才刚开始理解RNA编辑在疾病生物学中的重要性。但由于覆盖度取决于每个基因的表达水平,因此RNA的动态范围则成为了一个问题。如果我们想要以适当的灵敏度来检测低频突变,则需要让低丰度的RNA达到30倍的覆盖度。但你的测序read都被最高丰度的基因消耗了。
Q:RNA编辑的潜在应用有哪些?
JV:RNA编辑在评估肿瘤突变负荷(TMB)方面也许有重要的价值。TMB能测量癌细胞携带的所有突变,对于预测免疫肿瘤学疗法是否有反应非常重要。
研究人员一直在DNA水平研究TMB,可能是因为这种方法比较简单。在RNA水平研究TMB虽然比较困难,但仍然是可行的,并且很有价值。具有高TMB的肿瘤细胞有更多的新抗原,它们可以被免疫系统识别,引起抗肿瘤应答。非同义突变可能会带来新抗原,它表达后会被RNA-Seq数据鉴定出来。而RNA编辑则是新抗原的另一来源。
我们的初步数据表明,我们称之为表达TMB(eTMB)的结果和基于DNA的TMB结果之间存在很强的相关性。我们与合作伙伴一起用临床数据进行了大规模研究,证明了如果将来自RNA编辑的新抗原表达的变异组合起来,也许能更好的预测检查点抑制剂的反应。TMB评分是每Mb蛋白编码区域的非同义突变的总数,因此检测灵敏度没那么重要。目前的TMB液体活检方法只能分析数百个基因。而有了RNA-Seq,我们可以分析更多的基因,获得更丰富的数据。我们看到了利用RNA进行这类分析的巨大潜力。
"RNA编辑在评估肿瘤突变负荷(TMB)方面也许有重要的价值。"
Q:Biogazelle会帮助客户进行临床前研究吗?
JV:将RNA测序应用于发现项目时,我们会转换到使用qPCR来开发诊断检测,把它用到临床前研究中,对受试者进行分类并将其作为伴随检测。我们会在其中一个开发阶段中,使用与RNA-Seq发现研究样本相同的样本,以确保我们可以使用qPCR作为正交验证方法来重复研究结果。我们大部分客户和合作者都希望进行临床级的检测,而qPCR通常就足够了。将来也许会不一样,但现在还没有太多使用测序的临床RNA检测。我们可以利用qPCR来构建受控的临床级诊断试剂盒。
Q:您进行过哪些类型的数据分析?
JV:我们首先会进行差异基因表达分析,比较各个样本或样本组。在这种经典的RNA研究方法之后,我们会用2种先进的生物信息学方法来评估基因特征。第一种是基因集表达丰度分析,使用Broad研究所的基因集表达丰度分析算法。它可以按倍数变化差异或P值对基因进行排序。这是一种可靠、灵敏的计算方法,能区分细微的模式。它可以揭示基因集或通路水平的信息,帮助我们了解样本组的情况。
第二种方法是反卷积分析,能估计RNA样本中存在的不同细胞或组织类型的贡献。肿瘤主要由癌细胞、基质细胞和免疫细胞组成。我们可以利用反卷积方法来了解肿瘤中有哪些细胞类型,及其所占的比例。我们也在将这种方法应用于体液,但成功与否取决于基因特征(细胞和组织类型的特征)的质量。我们已经获得了液体的反卷积结果。我们在血浆、尿液和脑脊液(CSF)中看到了多种细胞类型的特征,这些特征都是有意义的,并且会随时间的推移而发生变化。这些RNA特征可以用来证明癌症是否存在,是否已经复发或正在缓解。我期待着使用这些先进的分析方法来获得重要的发现。
Q:你们向客户提供的数据有哪些?
JV:我们向客户提供什么数据取决于他们需要回答什么问题。他们通常想要的是基因水平的定量数据。但对于剪接变异、突变分析、RNA编辑和环状RNA数据的需求也在增加。客户会收到原始数据、处理后的数据,以及一份结果报告。
"RNA分析在液体活检领域有巨大的发展机会,在肿瘤学领域之外亦是如此。"
Q:与DNA测序数据相比,RNA-Seq数据对于疾病评估的价值是什么?
JV:我相信RNA-Seq数据提供的信息量与DNA测序数据提供的一样多,甚至更加丰富。除了基因表达分析,我们还能确定拷贝数变异7,8、突变7和RNA编辑,并进行T细胞受体分析9和免疫细胞分析。10如果将目光从蛋白编码区域转移到lncRNA上,你会发现lncRNA中的潜在生物标记明显更多,lncRNA中有50,000个潜在的基因,而蛋白编码区域只有20,000个。最终,它的价值也许体现在同时分析RNA和DNA特征来评估癌症或疾病样本。
Q:您认为液体活检未来将如何发展?
JV:基于DNA分析的液体活检在肿瘤学领域的应用发展迅速。我刚刚在2019年精准液体活检会议(Precision Liquid Biopsy Conference)上进行了发言,希望我成功传达了RNA分析对于液体活检的价值。单独使用DNA时,动态范围和反应性都不足。ctDNA最多只能提供关于癌细胞和突变的信息。它不能提供宿主如何对肿瘤做出反应,或者免疫系统或基质细胞与肿瘤的相互作用的信息。我们可以用RNA分析来检测这些信号,包括囊泡和血小板的情况。有一个新领域专注于肿瘤影响的血小板,并且正在围绕纯化囊泡的使用来开发新的治疗方法,以此治疗各种人类疾病(例如癌症或心脏病)。RNA分析在液体活检领域有巨大的发展机会,在肿瘤学领域之外亦是如此。
Q:Biogazelle的后续发展计划是什么?
JV:我们希望把Biogazelle的客户群发展到欧洲以外,并继续提供独特的服务。我们不仅仅是RNA-Seq服务提供商。我们还设计实验,进行大量的生物信息学分析并为客户提供对于数据的见解,支持他们开发有价值的诊断和治疗方法的下一步工作。我们需要进行宣传。
查看有关Biogazelle RNA-Seq工作流程的更多信息:
特色新闻稿:
参考文献
- Leucci E, Vendramin R, Spinazzi M, et al.Melanoma addiction to the long non-coding RNA SAMMSON.Nature.2016;531:518–522.
- Blokhin I, Khorkova O, Hsiao J, et al.Developments in lncRNA drug discovery: where are we heading? Expert Opin Drug Discov.2018;13:837–849.
- Biogazelle.Expertise/liquid biopsies. www.biogazelle.com/expertise/liquid-biopsies.Accessed June 17, 2019.
- Vo JN, Cieslik M, Zhang Y, et al.The Landscape of Circular RNA in Cancer.Cell.2019;176:869–881.
- Chen S, Huang V, Xu X, et al.Widespread and Functional RNA Circularization in Localized Prostate Cancer.Cell.2019;176:831–843.
- Smid M, Wilting SM, Uhr K, et al.The circular RNome of primary breast cancer.Genome Res.2019; 29:356–366.
- Piskol R, Ramaswami G, Li JB.Reliable identification of genomic variants from RNA-seq data.Am J Hum Genet.2013;93:641–651.
- Tirosh I, Izar B, Prakadan SM, et al.Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. Science.2016;352:189–196.
- Li B, Li T, Pignon JC, et al.Landscape of tumor-infiltrating T cell repertoire of human cancers.Nat Genet.2016;48:725–732.
- Newman AM, Liu CL, Green MR, et al.Robust enumeration of cell subsets from tissue expression profiles.Nat Methods.2015;12:453–457.