在分子生物学中,开放阅读框(Open Reading Frame, ORF)从起始密码子开始,是DNA序列中具有编码蛋白质潜能,结束于终止密码子连续的碱基序列。

由于密码子(codon)读写起始位点的不同,DNA序列可能按六种ORF阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别则是确定哪种开放阅读框对应真正的多肽编码序列的过程。

在真核生物中,ORF可能跨过外显子,在mRNA中进行拼接。

中文名

开放阅读框

外文名

Open Reading Frame(ORF)

别名

开放式阅读框架

拼音

kāi fàng yuè dú kuàng

定义

结构基因的正常核苷酸序列

出处

生物学

类型

科学术语

词语释义

开放阅读框[open reading frame,ORF] 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。

在mRNA序列中,每三个连续碱基(即三联“密码子”)编码相应的氨基酸。其中有一个起始密码子AUG和三个终止密码子UAA,UAG,UGA。核糖体从起始密码子开始翻译,沿着mRNA序列合成多肽链并不断延伸,遇到终止密码子时,多肽链的延伸反应终止。由于读写位置不同,ORF在两条链上具有六种可能性。

一条链中的3种ORF

软件介绍

现在有很多找ORF的软件,包括在线的,如:ORF Finder的功能ORF Finder被用来预测已存在的编码区的小基因序列。它较早应于序列设计,应用优于长片断、高质量的匹配。ORF Finder把提交序列分成六个亚区,并对这六个阅读框分别进行默认,赋予每个亚区一个确定其编码内容的度量,如果可能将对每一亚区进行进一步分析。每个亚区按照已有的分类结果,被随机提交给查找它们是否编码 蛋白质的特定测试收集器。最后只有那些具有编码潜能的重要区域才被报道。