一旦确定遗传变异与特定的复杂疾病相关,就必须弄清楚它如何参与中以及其生物学效应。某一变异可能对蛋白质结构、基因表达和调控产生多种影响,也可能根本没有影响。使用基因组学、转录组学和表观遗传学方法进行数量性状基因位点(QTL)分析,可以注释与疾病相关的变异及其对疾病差异表达基因的功能影响,阐明疾病机制,对基因和通路进行优先排序,以供进一步研究。
差异表达分析可识别和测量不同条件下或针对特定刺激的基因表达变化。了解哪些基因在疾病表型中过度表达或表达不足,是确定哪些基因和通路受到影响或可能与疾病有关的重要步骤。尽管芯片是最早应用于大规模表达研究的技术,但它们在很大程度上已被新兴的RNA测序(RNA-Seq)取代了。RNA-Seq不仅能提供有关转录本亚型、基因融合、剪接变异和其他特征的信息,还能提供有关基因表达的信息,而且无需先验知识。
差异基因表达分析的RNA-Seq工作流程始于RNA提取、文库制备和测序。数据分析包括read后处理、单个基因表达水平的估计、差异表达基因的归一化和鉴定。以下方法可用于深入了解转录组及其在复杂疾病中的潜在作用:
表观遗传学研究的是在不改变DNA序列的情况下通过调控机制改变基因活性的生物学机制。该学科可识别基因调控机制的状态,例如开放染色质、甲基化、启动子与转录因子的结合,可了解为什么基因能在特定水平上表达。除了在正常生物学过程中具有重要功能外,表观遗传过程还与各种复杂疾病存在联系,包括癌症、自身免疫性疾病、神经系统疾病和精神疾病。以下方法可用于深入了解表观基因组及其在复杂疾病中的潜在作用。
全基因组测序是鉴定与复杂疾病相关的罕见变异的常用方法。它是唯一可以在整个基因组中寻找常见变异和罕见变异的方法,包括可能导致疾病的结构变异。
CNV通常由结构重排引起,是一种可导致一个或多个基因拷贝数异常的基因组改变现象。像SNP一样,某些拷贝数变异与疾病易感性有关。基于芯片的方法对于新发CNV(父母基因中不存在或不是遗传自父母)的检测十分有效,可提供可靠的大规模分析。芯片可用于分析扩增、缺失、重排和拷贝数中性的杂合性缺失等基因组变异。然而,常见CNV的作用(结果)目前基本未知。
基因分型芯片虽然对于大规模的CNV检测非常有效,但其在检测小片段CNV(<5万碱基对)时灵敏度欠佳。NGS可提供碱基对级别的分辨率,能够检测芯片技术无法检出的小CNV片段。该优势可用于复杂疾病的遗传性缺失研究。高分辨率测序和高通量芯片为实现研究目标提供了有效的全基因组选项。
数量性状基因位点(QTL)是与特定表型或性状相关的DNA区域,在不同人群中有所不同。通常情况下,QTL与连续型变化的性状(例如身高或肤色)有关,而与离散型变化的性状(例如头发或眼睛的颜色)无关。QTL定位是一种统计分析,可识别哪些分子标记会导致特定性状的定量变化。由于单个基因位点可能包含许多变异,因此填充或全基因组测序是进行QTL定位并精确识别参与的分子标记的关键先决条件。QTL已进行了扩展,纳入了在基因型到表型的连续体中在不同水平起作用的变异。
QTL分析是一种注释疾病相关变异的有效方法。它可以了解变异的功能性影响,区分导致疾病的变异和与疾病有关的变异。研究人员可以利用不同的QTL分析,发现变异与受其影响的基因构成的分子相互作用网络,并指出哪些基因和通路真正引发了疾病。这样有助于将时间、资源和资金投入到最可能与疾病有关的靶点上。
综合各种Illumina遗传分析结果可有效解决疑难问题。Illumina提供支持数据集成的数据分析软件,例如用于eQTL分析的基因分型(包含基因表达)。
阅读技术说明表达数量性状基因位点(eQTL)是影响一个或多个基因表达的遗传变异。eQTL可以顺式(局部)或反式(有一定距离,例如在不同的染色体上)作用于其基因靶点。eQTL定位需要通过芯片或WGS对全基因组进行基因分型,并通过RNA-Seq对每个样本进行基因表达分析。
甲基化数量性状基因位点(meQTL)是影响DNA甲基化模式的遗传变异。meQTL可以影响延伸基因组区域的甲基化。meQTL定位需要通过芯片或测序进行全基因组基因分型和DNA甲基化分析。
染色质可及性数量性状基因位点(caQTL)是影响核小体包装、定位和染色质可及性的遗传变异。caQTL定位需要通过芯片或WGS进行全基因组基因分型,并通过ATAC-Seq或Hi-C等方法进行染色质可及性分析。
结合数量性状基因位点(bQTL)是影响转录因子结合的遗传变异。bQTL定位需要通过芯片或WGS以及ChIP-Seq进行全基因组基因分型。