唯一分子标记(UMI)是一种分子条形码,可以在测序过程中错误校正,提高准确性。
这些分子条形码均为短序列,可特异性的标记样本文库中的每个分子。UMI可用于各种测序应用,许多是与DNA和cDNA的PCR重复相关的应用。RNA-seq基因表达分析和其他定量测序方法也可以采用UMI来去除重复。
UMI测序可以降低假阳性变异检出的概率,同时能提高变异检测的灵敏度。由于起始材料中的每个核酸都有唯一的分子条形码,因此,生物信息学软件可以高度精确地过滤出重复的read和PCR错误,报告唯一read,从而在最终数据分析之前消除已识别的错误。
虽然这两项技术均可在下游数据分析期间用于多重分析和样本拆分,但其关键的区别在于UMI测序会在PCR扩增之前使用唯一的序列标记样本中的每个分子。
使用唯一双标签序列时,每个样本文库都具有特定的样本标签。样本中的所有核酸都使用相同的序列标签来标记,所得的文库会与其他文库进行混合,并在一次运行中进行并行测序。
UMI会在给定样本文库中的每个分子上添加一个唯一条形码。通过在每个原始DNA片段上添加单独的条形码,可以将原始样本中的变异等位基因(真实变异)与文库制备、靶向富集或测序过程中引入的错误区分开。