编码区
基因的编码区(英語:),亦称为“编码序列”(Coding sequence)或“CDS”(Coding DNA Sequence),是指DNA或RNA中由外显子组成,编码蛋白质的部分。该区域的边界范围从靠近5′末端的起始密码子开始,到靠近3′末端的终止密码子为止。mRNA的编码区范围位于5′非翻译区和部分同样为外显子的3′非翻译区之间。[1]
编码序列注释
虽然识别DNA序列内的开放阅读框简单明了,但识别编码序列却并非如此,因为细胞只会把所有开放阅读框的一部分翻译为蛋白质。[3]目前CDS预测通过对细胞mRNA取样测序完成,但要判断给定mRNA究竟哪一部分实际翻译为了蛋白质,目前仍是问题。CDS预测属于基因预测的一部分,后者不仅包括对编码蛋白质的DNA序列预测,也包括对其它功能元件,如RNA基因和调节序列的预测。
参见
- 开放阅读框
- 基因预测
参考文献
- Twyman, Richard. . The Wellcome Trust. 1 August 2003 [6 April 2003]. (原始内容存档于2007年3月28日).
- Goto, Mami; et al. (PDF). The Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan. April 8, 2000 [6 April 2009]. (原始内容 (PDF)存档于2003年6月22日).
- Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi. (PDF). Genome Research (Cold Spring Harbor Laboratory Press). September 2011, 21 (9): 1478–1487 [18 September 2011]. doi:10.1101/gr.1060303. (原始内容 (PDF)存档于2019-10-01).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.