在分子生物学和遗传学领域,基因组是指生物体所有遗传物质的总和。这些遗传物质包括DNA或RNA(病毒RNA)。

中文名

基因组

外文名

Genome

数目

人类数目约为2.5万个

地位

遗传信息载体

组成

DNA 和RNA(病毒)

类型

生物遗传

简介

在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,又称基因体(genome)。基因组包括基因和非编码DNA。1920年,德国汉堡大学植物学教授汉斯·温克勒(Hans Winkler)首次使用基因组这一名词。

更精确地讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。例如,生物个体体细胞中的二倍体由两套染色体组成,其中一套DNA序列就是一个基因组。基因组一词可以特指整套核DNA(例如,核基因组),也可以用于包含自己DNA序列的细胞器基因组,如线粒体基因组或叶绿体基因组。当人们说一个有性生殖物种的基因组正在测序时,通常是指测定一套常染色体和两种性染色体的序列,这样来代表可能的两种性别。即使在只有一种性别的物种中,“一套基因组序列”可能也综合了来自不同个体的染色体。通常使用中,“遗传组成”一词有时在交流中即指某特定个体或物种的基因组。对相关物种全部基因组性质的研究通常被称为基因组学,该学科与遗传学不同,后者一般研究单个或一组基因的性质。

种类

病毒

病毒基因组可以由RNA或DNA组成。 RNA病毒的基因组包含单链或双链RNA,也包含一种或多种单独的RNA分子。 DNA病毒基因组可以是单链或双链DNA。大多数DNA病毒基因组由单个线性DNA分子组成,但有些由DNA病毒基因组由环状DNA分子组成。

原核

原核生物和真核生物基因组由DNA组成。古细菌有一个环状染色体组成的DNA基因组。大多数细菌也有一个环状染色体,然而,一些细菌物种含有线性染色体  或多个染色体。大多数原核生物基因组中不含有重复DNA  。一些共生细菌基因组种含有高比例的假基因,例如Serratia symbiotica基因组种只有约40%的DNA编码蛋白质。一些细菌基因组还含有辅助遗传物质,它们在质粒中存在。为此,基因组这个词不应该用作染色体的同义词。

真核

真核基因组由一条或多条线性DNA染色体组成。组成真核生物基因组的染色体的数量差异很大,杰克跳线蚂蚁和无性线虫的基因组每个只有一对染色体,而蕨类物种有720对染色体。人类细胞具有22对常染色体和1对性染色体。

除了细胞核中的染色体外,真核生物的细胞器如叶绿体和线粒体都有自己的DNA和染色体,因此,也有“线粒体基因组”和“质体基因组”的说法。与它们来源的细菌一样,线粒体和叶绿体都含有环状染色体。

与原核生物不同,真核生物具有蛋白质编码基因的外显子 -内含子组织和一定数量的重复DNA。哺乳动物和植物基因组的大多数由重复DNA组成。

编码序列

携带合成蛋白质遗传信息的DNA序列是编码序列。不同物种中编码序列占基因组的比例差异很大。较大的基因组不一定含有更多的基因,并且复杂真核生物中非重复DNA的比例随着基因组大小的增加而减少。简单的真核生物如秀丽隐杆线虫和果蝇中,编码DNA比例高于重复DNA  ,而更复杂真核生物基因组则往往主要由重复DNA组成。一些植物和两栖动物基因组中重复DNA的比例超过80%  。同样,人类基因组中只有2%编码DNA。

非编码序列

非编码序列包括内含子,非编码RNA的序列,调控DNA和重复DNA。人类基因组的98%属于非编码序列。基因组的重复DNA有串联重复序列和分散重复序列。

转座子

转座子(TEs)是具有特定结构的DNA序列,它们可以在基因组中跳动,位置不固定。I类TE通过复制和粘贴机制跳动位置,II类TE从基因组中切除并插入新位置。

TE的运动是真核生物基因组进化的驱动力,因为它们的插入可以破坏基因功能,TE之间的同源重组可以导致基因的复制,TE还可以将外显子和调节序列改组到新的位置。

反转录转座子

反转录转座子可以转录成RNA,然后在另一个位点被复制到基因组中。反转录转座子可分为长末端重复序列(LTR)和非长终端重复序列(非LTR)两大类反转录转座子。

大小

基因组大小是一个拷贝的单倍体基因组中DNA碱基对的总数。

基因组大小与原核生物和低等真核生物的形态复杂性呈正相关。然而,在软体动物和上述所有其它高等真核生物之后,这种相关性已不再存在,主要是因为重复DNA的缘故。

改变

生物体所有细胞都源自同一个单细胞,因此它们应该具有相同的基因组。但是,在某些情况下,细胞间会出现差异。细胞分裂期间的DNA复制和环境诱变剂的作用都可导致体细胞发生突变。在某些情况下,这种突变会导致癌症,因为它们会导致细胞更快地分裂并侵入周围组织。在减数分裂期间,二倍体细胞分裂两次以产生单倍体生殖细胞。在此过程中,重组导致遗传物质从同源染色体重新洗牌,因此每个配子具有独特的基因组。

进化

基因组不仅仅是生物体基因的总和,基因组还含有其它可以考虑特定基因及其产物的特征。

复制在基因组的塑造过程中起了重要作用。复制的范围包括短串联重复序列的延伸、基因簇的复制、整个染色体甚至整个基因组的复制。这种复制可能是创造遗传新性状的基础。

遗传变异

基因组

必须指出仅有一个基因组并不能获得物种的遗传差异或遗传多态性。例如,原则上讲,人类基因组序列可以仅仅从某个个体的一个细胞的一半DNA中测定。要知道是哪些DNA变异导致特定性状或疾病则需要进行个体间比较。这一点也解释了通常使用“基因组”(与通常使用“基因”相提并论)不仅仅指某特定DNA序列,也指某物种整个家族的序列。

尽管这个概念看上去与直觉相抵触,其实这与说没有任何一个特定的形状是印度豹的形状是相同的概念。印度豹形状各异,它们的基因组序列也并不相同。然而各动物个体和它们的序列都有共性,因此可以从单一实例中来了解印度豹和“豹性”。

最小基因组

既然基因组和相应生物体如此复杂,一种研究策略就是减少基因组中的基因数目至最小但仍可以使生物体理论上可以生存。对于单细胞生物和多细胞生物最小基因组的实验研究已经开展。这些工作在体内和体外进行。通过理解最小生物体的功能,然后不断增加其复杂性,从而理解诸如癌症等多细胞疾病。

基因组计划

人类基因组计划旨在对人类基因组绘制物理图谱并测序。其他基因组计划包括小鼠,水稻,拟南芥,河豚和细菌(如大肠杆菌)等。通过各种基因组计划,许多基因组已被测序。测序费用一直在降低,可能最终测序单个基因组只需要几千美元。

大小的比较

生物基因组大小(碱基对)
病毒, 噬菌体Φ-X174;5387 - 最早完成测序的基因组
病毒, 噬菌体λ5×104
细菌, 大肠杆菌4×106
变形虫, 无恒变形虫(Amoeba dubia)67×1010 - 2005年12月已知的最大基因组
植物,一种贝母(Fritillary assyriaca13×1010
展开表格

注:一个人类细胞的DNA长度约为1.8米。

特点

真核生物、原核生物和病毒的基因组有不同的特点。

真核生物

1.基因组较大。真核生物的基因组由多条线形的染色体构成,每条染色体有一个线形的DNA分子,每个DNA分子有多个复制起点;

2.不存在操纵子结构。真核生物的同一个基因簇的基因,不会像原核生物的操纵子结构那样,转录到同一个mRNA上;

3.存在大量的重复序列。真核生物的基因组里存在大量重复序列,通过其重复程度可将其分成高度重复序列、中度重复序列、低度重复序列和单一序列;

4.有断裂基因。大多数真核生物为蛋白质编码的基因都含有“居间序列”,即不为多肽编码,其转录产物在mRNA前体的加工过程中被切除的成分;

5.真核生物基因转录产物为单顺反子;

6.功能相关基因构成各种基因家族。

原核生物

1.基因组较小,通常只有一个环形或线形的DNA分子;

2.通常只有一个DNA复制起点;

3.非编码区主要是调控序列;

4.存在可移动的DNA序列;

5.基因密度非常高,基因组中编码区大于非编码区;

6.结构基因没有内含子,多为单拷贝,结构基因无重叠现象;

7.重复序列很少,重复片段为转座子;

8.有编码同工酶的等基因;

9.基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短;

10.功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成,这种结构称操纵子。

病毒

1. 不同病毒基因组大小相差较大;

2.不同病毒基因组可以是不同结构的核酸;

3. 除逆转录病毒外,通常为单倍体基因组;

4.有的病毒基因组是连续的,有的病毒基因组分节段;

5. 有的基因有内含子;

6. 病毒基因组大部分为编码序列;

7. 基因重叠。

研究

2015年3月,中科院昆明动物所和深圳华大基因国家基因库的研究人员成功破译了高山倭蛙基因组,这是迄今为止破译的全世界首个现代蛙类基因组,也是目前破译的全世界第二个两栖动物的基因组。此次研究为两栖动物进化研究提供了新线索,相关研究成果在美国科学院院刊(PNAS)杂志在线发表。