当一个人提到基因组时,通常表示个体DNA所包含的全部信息。事实上,基因组包括所有DNA及读取和维持它的蛋白质,还有许多帮助存储和产生DNA结构的颗粒。把整个基因组想象成一个图书馆,DNA就是基因组百科全书。
基因组百科全书的信息由分布在23对染色体上的21,000个基因组成。每个个体有两拷贝几乎完全相同的染色体,分别来自父母。
所有整个基因组百科全书由特定的语言——DNA代码写就。DNA字母表只有四个字母——A、C、T和G,代表四个不同的化学碱基。每个人在23条染色单体上有超过30亿个DNA字母。
虽然可能出现一长串DNA字母,通过学习DNA代码,研究人员发现还有一套复杂的标点符号用法系统。当DNA字母是基因的一部分时,特定编码传达出特别的信号。三个DNA字母组合表示特定氨基酸。在基因的作用下,氨基酸提供被人体内特定物质读取的指令,来决定需要生产何种类型的蛋白质。
所有DNA字母的顺序被称作基因组序列。当某人提到基因组序列时,他们指的是唯一的DNA序列组合,从1号染色体到性染色体(XX或XY)。虽然我们有两拷贝染色体,但是我们只报告一条完整序列。
这是因为在两个染色体集中DNA序列大多数相同。只要有差异,这个差异就会出现在其中一条基因组序列中。人与人之间的基因组序列非常相似。实际上,人基因组序列超过99%是共有的。这很有道理,因为我们属于同一物种(人类),而且我们的身体具有相似的特征(例如,两条手臂、两只眼睛、十个脚趾),以相似的方式运转。
由于基因组序列超过30亿个字母,因此1%的差异对于人与人之间的变异空间来讲是巨大的。没有两个基因相同的人(同卵双胞胎除外)。正是这些"差异"造就了你,真正的你。
了解基因组学如何通过帮助研究人员查明疾病的根本原因、优化治疗并实现更好的结果来推进精准医疗的发展。