基因频率(gene frequency)是指在一个种群基因库中,某个基因占全部等位基因数的比率。群体中某一特定基因的频率可以从基因型频率(genotype frequency)来推算。如人们熟悉的人的MN血型,它是由一对共显性等位基因M和N所决定,产生3种基因型M/M、M/N和N/N,而相应的表型是M、MN和N,而且比例是1/4M、1/2MN和1/4N。这个原理可以推广到一般群体内婚配,如以群体中MN表型(基因型)的具体样本数被所观察到总数相除即可得到(转换)相对频率数。

中文名

基因频率

外文名

Gene frequency

基本概念

在一个种群基因库中,某个基因占全部等位基因数的比率

学科

生物

领域

生命科学

作用

有利于理解该种群的进化情况

概念比较

基因频率是某种基因在某个种群中出现的比例。基因型频率是某种特定基因型的个体占群体内全部个体的比例。前者是某基因个体数占全部基因数的比例,后者是某基因型个体数占群体总数的比例。

用途

基因频率是指在一个种群基因库中,某个基因占全部等位基因数的比例。种群中某一基因位点上各种不同的基因频率之和以及各种基因型频率之和都等于1。对于一个种群来说,理想状态下种群基因频率在世代相传中保持稳定,然而在自然条件下却受基因突变、基因重组、自然选择、迁移和遗传漂变的影响,种群基因频率处于不断变化之中,使生物不断向前发展进化。因此,通过计算某种群的基因频率有利于理解该种群的进化情况。

计算

基因频率

⑴设二倍体生物个体的某一基因座上有两个等位基因A和a,假设种群中共有N个个体,而AA、Aa、aa三种基因型的个体数分别为n1、n2、n3,那么种群中A基因的频率和AA基因型的频率分别是:

①A基因的频率=A基因的总数/(A基因的总数+a基因的总数)=(2n1+n2)/2N 或 n1/N+n2/2N

②AA基因型的频率=AA基因型的个体数/该二倍体群体总数=n1/N。

⑵基因频率与基因型频率的计算关系,由上述①②推得:A基因的频率=n1/N+1/2·n2/N=AA基因型的频率+1/2·Aa基因型的频率。

基因频率计算类型及其公式推导

理想状态计算

理想状态下的种群就是处于遗传平衡状况下的种群,遵循“哈迪──温伯格平衡定律”。遗传平衡指在一个极大的随机自由交配的种群中,在没有突变发生,没有自然选择和迁移的条件下,种群的基因频率和基因型频率在代代相传中稳定不变,保持平衡。

一个具有Aa基因型的大群体(处于遗传平衡状态的零世代或某一世代),A基因的频率P(A)=p,a基因的频率P(a)=q,显性基因A的基因频率与隐性基因a的基因频率之和p+q=1,其雌雄个体向后代传递基因A型配子的频率为p,与其相对应的传递隐性基因a型配子的频率为q,则可用下表1来表示各类配子的组合类型、子代基因型及其出现的概率:

表1

雄配子雌配子A(p)a(q)
A(p)AA(p^2)Aa(pq)
a(q)Aa(pq)aa(q^2)

由上表可知该种群后代中出现三种基因型AA、Aa、aa,并且三种基因型出现的频率分别为P(AA)= p×p= p^2=D;P(Aa)=2×p×q=2pq=H; P(aa)= q×q = q^2=R。且它们的频率之和为p^2+2pq+q^2=(p+q)^2=1。其基因频率为A基因的频率P(A)=D+1/2·H= p^2+ pq=p(p+q)=p;a基因的频率P(a)= R+1/2·H=q^2+ pq=q(p+q)=q。可见子代基因频率与亲代基因频率一样。所以,在以后所有世代中,如果没有突变、迁移和选择等因素干扰,这个群体的遗传成分将永远处于p^2+ 2pq+q^2的平衡状态。伴性基因和多等位基因遗传平衡的计算仍遵循上述规律。运用此规律,已知基因型频率可求基因频率;反之,已知基因频率可求基因型频率。调查,该病的发病率大约为1/10000,请问在人群中该苯丙酮尿症隐性致病基因(a)的基因频率以及携带此隐性基因的携带者(Aa)基因型频率分别是()

A.1% 和0.99% B.1% 和1.98% C.1% 和3.96% D.1% 和0.198%

解析:苯丙酮尿症是一种常染色体隐性遗传病。由于该病则发病基因型为aa,即aa=0.0001,a=0.01,A= 1-a=1-0.01=0.99,携带者基因型为Aa的频率 = 2×0.01×0.99=0.0198。

答案:B

变式1.在某个海岛上,每一万个人中有500名男子患红绿色盲,则该岛上的人群中,女性携带者的数量为每万人中有多少?( 假设男女比为1:1)(B)

A.1000人 B.900人 C.800人 D.700人

变式2:人的ABO血型决定于3个等位基因IA、IB、i。通过抽样调查发现血型频率(基因型频率):A型(IAIA,IAi)=0.45;B型(IBIB,IBi)=0.13;AB型(IAIB)=0.06;O型(ii)=0.36.试计算IA、IB、i这3各等位基因的频率。

答案:IA频率为0.3 ,IB频率为0.1,i频率为0.6。

自然状态计算

对于生活在自然界中的种群来说,理想状态下的条件是不可能同时存在,种群基因频率不可能保持平衡,而是处于不断变动和发展的。这种非平衡群体常采用抽样调查的方法获得的数据来计算其基因频率,根据基因所在位置可分为两种类型。

2.1

关于常染色体遗传基因频率的计算

由定义可知,某基因频率=某基因的数目/该基因的等位基因总数×100%。若某二倍体生物的常染色体的某一基因位点上有一对等位基因A、a,他们的基因频率分别为p、q,可组成三种基因型AA、Aa、aa,基因型频率分别为D、H、R,个体总数为N,AA个体数为n1 ,Aa个体数为n2 ,aa个体数为n3 ,n1+n2+n3=N。那么:

基因型AA的频率=D=n1/N,n1=ND;

基因型Aa的频率=H=n2/N,n2=NH;

基因型aa的频率=R=n3/N,n3=NR;

基因A的频率P(A)=(2n1+n2)/2N=(2ND+NH)/2N=D+1/2·H=p

基因a的频率P(a)=(2n3+n2)/2N=(2NR+NH)/2N=R+1/2·H=q

因为p+q=1所以D+1/2H+R+1/2H= D+R+H=1

由以上推导可知,

①常染色体基因频率的基本计算式:

某基因频率=(2×该基因纯合子个数+1×杂合子个数)/2×种群调查个体总数

②常染色体基因频率的推导计算式:

某基因频率=某种基因的纯合子频率+1/2杂合子频率

例题:从某个种群中随机抽出100个个体,测知基因型为AA、Aa和aa的个体分别是30、60和10个。求这对等位基因的基因频率。

解法一:

先求出该种群等位基因的总数和A或a的个数。100个个体共有200个基因;其中,A基因有2×30+60=120个,a基因有2×10+60=80个。然后由常染色体基因频率的基本式计算求得:

A基因的频率为:120÷200=60%

a基因的频率为:80÷200=40%

解法二:

由题意可知,AA、Aa和aa的基因型频率分别是30%、60%和10%,由常染色体基因频率的推导式计算求得:

A基因的频率为:30%+1/2×60%=60%

a基因的频率为:10%+1/2×60%=40%

变式1:已知人眼的褐色(A)对蓝色(a)是显性,属常染色体上基因控制的遗传。在一个30000人的人群中,蓝眼的有3600人,褐眼的有26400人,其中纯合子有12000人,那么,这一人群中A和a基因的基因频率分别为(A)

A.64%和36% B.36%和64% C.50%和50% D.82%和18% E.58%和42%

变式2:在一个种群中随机抽出一定数量的个体,其中,基因型为BB的个体占40%,基因型为Bb的个体占50%,基因型为bb的个体占10%,则基因B和b的频率分别是(B)

A. 90%,10% B. 65%,35% C. 50%,50% D. 35%,65%

2.2

关于X或Y染色体遗传基因频率的计算

对于伴性遗传来说,位于X、Y同源区段上的基因,其基因频率计算与常染色体计算相同;而位于X、Y非同源区段上的基因,伴X染色体遗传,在Y染色体上没有该基因及其等位基因。同理伴Y染色体遗传,在X染色体上也没有其对等的基因。所以在计算基因总数时,应只考虑X染色体(或Y染色体)上的基因总数。若某二倍体生物的X染色体的某一基因位点上有一对等位基因B、b,他们的基因频率分别为p、q,可组成五种基因型XBXB、XBXb、XbXb 、XBY和XbY,基因型频率分别为E、F、G 、H和I,个体总数为N,XBXB个体数为n1 ,XBXb个体数为n2 ,XbXb个体数为n3 ,XBY个体数为n4、XbY个体数为n5。且n1+n2+n3=n4+n5那么:

E=n1 /N、 F=n2 /N、G=n3 /N、H=n4 /N、 I=n5 /N;

p(B)=(2n1 +n2 +n4)/[2(n1+n2+n3)+(n4+n5)]=(2n1 +n2 +n4)/1.5N=2/3(2E+F+H)

p(b)=(2n3 +n2 +n5)/ [2(n1+n2+n3)+(n4+n5)]=(2n3 +n2 +n5)/ 1.5N=2/3(2G+F+I)

由以上推导可知,

①X染色体基因频率的基本计算式:

某基因频率=(2×该基因雌性纯合子个数+雌性杂合子个数+雄性含该基因个数)/(2×雌性个体总数+雄性个体数)

②X染色体基因频率的推导计算式:

某种基因的基因频率=2/3(2×某种基因雌性纯合体频率+雌性杂合体频率+雄性该基因型频率)(雌、雄个体数相等的情况下)

例题:从某个种群中随机抽出100个个体,测知基因型为XBXB、XBXb、XbXb和XBY、XbY的个体分别是44、5、1和43、7。求XB和Xb的基因频率。

解法一:

就这对等位基因而言,每个雌性个体含有2个基因,每个雄性个体含有1个基因(Y染色体上没有其等位基因)。那么,这100个个体共有150个基因,其中雌性个体的基因有2×(44+5+1)=100个,雄性个体的基因有43+7=50个。而XB基因有44×2+5+43=136个,基因Xb有5+1×2+7=14个。于是,根据X染色体基因频率的基本式计算求得:

XB的基因频率为:136÷150≈90.7%

Xb的基因频率为:14÷150≈9.3%

解法二:

由题意可知,XBXB、XBXb、XbXb和XBY、XbY的基因型频率分别 44%、5%、1%和43%、7%,因为雌性、雄性个体的基因型频率各占50%,于是,由X染色体基因频率的推导式计算求得:

XB基因的基因频率=2/3×(2×44%+5%+43%)≈90.7%

Xb基因的基因频率=2/3×(2×1%+5%+7%)≈9.3%

变式1:某工厂有男女职工各200名,调查发现,女性色盲基因的携带者为15人,患者5人,男性患者11人。那么这个群体中色盲基因的频率是(B)

A. 4.5% B. 6% C. 9% D. 7.8%

解法:色盲基因(a隐性)数=5*2+15+11,非色盲基因(A,显性)和色盲基因总和=200*2+200,因此色盲基因的频率为36/600=0.06

变式2:对欧洲某学校的学生进行遗传调查时发现,血友病患者占0.7%(男∶女=2∶1);血友病携带者占5%,那么,这个种群的X的频率是( C )

A.2.97% B.0.7% C.3.96% D.3.2%

解析:

方法一:这里首先要明确2:1为患者中男女的比例,人群中男女比例为1:1。假设总人数为3000人。则男患者为3000×0.7%×2/3=14,女患者为3000×0.7%×1/3=7。携带者为3000×5%=150。则X的频率=(14+7×2+150)/(1500×2+1500)=3.96%。

方法二:人群中男女比例为1:1,根据X染色体基因频率的推导式计算求得:

X的频率=2/3(0.7%×1/3×2+0.7%×2/3+5%)=3.96%。

答案:选C。

总之,尽管基因频率的计算类型复杂多样,其思维方法又迥然各异,但是我们只要把握住基因频率计算的条件和方法规律,弄清原委并灵活运用,就能准确地计算出正确的答案。

主要参考文献

1.李 难.进化论教程.北京:高等教育出版社,1990.9:244—276.

2.朱正威,赵占良.普通高中课程标准实验教科书生物必修2遗传与进化.北京:人民教育出版社,2007:115

定律

哈代-温伯格定律

也称“遗传平衡定律”,1908年,英国数学家戈弗雷·哈罗德·哈代(Godfrey Harold Hardy)最早发现并证明这一定律;1909年,德国医生威廉·温伯格(Wilhelm Weinberg)也独立证明此定律,故得名哈代-温伯格定律。

主要用于描述群体中等位基因频率以及基因型频率之间的关系。内容为:

①一个无穷大的群体在理想情况下进行随机交配,经过多代,仍可保持基因频率与基因型频率处于稳定的平衡状态。

②在一对等位基因的情况下,基因p(显性)与基因q(隐形)的基因频率的关系为:

(p+q)^2=1

二项展开得:p^2+2pq+q^2=1

可见,式中p^2为显性纯合子的比例,2pq为杂合子的比例,q^2为隐形纯合子的比例。

哈代-温伯格定律在多倍体等更加复杂的情况下也可应用。

[例1]一个种群中AA个体占30%,Aa的个体占60%,aa的个体占10%。计算A、a基因的频率。

[剖析]A基因的频率为30%+1/2×60%=60%

a基因的频率为10%+1/2×60%=40%

[

答案

]60% 40%

相关结论:

种群中一对等位基因的频率之和等于1,种群中基因型频率之和也等于1。基因频率的变化,导致种群基因库的变迁,所以说,生物进化实质上就是种群基因频率发生变化的过程。

高考信息

[例2](2006河北高考)在豚鼠中,黑色对白色是显性。如果基因库中90%是显性基因B,10%是隐性基因b,则种群中基因BB、Bb、bb的频率分别是()

A81% 18% 1%

B45% 40% 15%

C18% 81% 1%

D45% 45% 10%

[解题思路]BB频率为(90%)^2=81%,bb频率为(10%)^2=1%,Bb频率为2×90%×10%=18%,故选A

[

答案

] A

某小岛上原有果蝇20 000只,其中基因型VV、Vv、vv的果蝇分别占15%、55%和30%。若此时从岛外上入侵了2 000只基因型为VV的果蝇,且所有果蝇均随机交配,则F1中V的基因频率约是多少?

V基因频率=(20000*15%*2+20000*55%+2000*2)/44000=47.7%