Mã mở đầu là codon đầu tiên của RNA thông tin (mRNA) được dịch mã bởi ribosome. Các mã mở đầu luôn luôn mã hóa cho methionine trong sinh vật nhân chuẩn và Met được biến đổi (fMet) trong ở sinh vật nhân sơ. Codon bắt đầu phổ biến nhất là AUG.
Các mã mở đầu thường đứng sau một vùng 5′ không được dịch (5′ UTR). Ở bọn nhân sơ, vùng này bao gồm các vị trí liên kết ribosome (RBS).
Các mã bắt đầu thay thế là các mã mở đầu khác với codon AUG tiêu chuẩn và được tìm thấy ở cả hai loại sinh vật nhân sơ (vi khuẩn) và sinh vật nhân chuẩn. Các codon khởi đầu thay thế vẫn được dịch mã là Met khi chúng bắt đầu đợc tổng hợp protein (ngay cả khi codon đó mã hóa một amino acid khác). Điều này là do một RNA vận chuyển (tRNA) riêng biệt được sử dụng để bắt đầu dịch mã.[1]
Các chương trình tin sinh học thường cho phép các codon khởi đầu thay thế khi tìm kiếm các gen mã hóa protein.
Các codon khởi đầu thay thế (khác AUG) là rất hiếm trong hệ gen nhân chuẩn. Tuy nhiên, các codon bắt đầu khác AUG xảy ra tự nhiên đã được ghi nhận tại một số mRNA tế bào.[2] Bảy trong số chín thay thế nucleotide đơn có thể có ở codon khởi đầu AUG của enzyme dihydrofolate reductase có chức năng như các điểm bắt đầu dịch mã ở các tế bào động vật có vú.[3] Ngoài con đường Met-tRNA với codon AUG kinh điển, các tế bào động vật có vú có thể bắt đầu dịch với leucine bằng cách sử dụng một leucyl-tRNA đặc biệt dịch mã cho codon CUG..[4][5]
Hệ gen ty thể (và nhân sơ) sử dụng mã bắt đầu thay thế đáng kể hơn (AUA và AUU ở người và chủ yếu là GUG và UUG ở bọn nhân sơ).[6]
E. coli sử dụng 83% AUG (3542/4284), 14% (612) GUG, 3% (103) UUG [7] và một hoặc hai codon khác (ví dụ, AUU hoặc có thể là CUG).[8][9]
Các vùng mã hóa nổi tiếng mà không dùng codon khởi đầu AUG có thể kể đến như gen lacI (GUG)[10][11] và lacA (UUG) [12] trong operon lac ở E. coli. Hai nghiên cứu gần đây đã độc lập cho thấy rằng 17 codon khởi đầu không phải AUG có thể bắt đầu dịch mã ở E. coli.[13][14]
Tính chất hóa sinh của Axit amin không phân cực phân cực base acid Kết thúc: codon dừng Mã di truyền tiêu chuẩn base đầu tiên base thứ hai base thứ ba U C A G U UUU (Phe/F) Phenylalanine UCU (Ser/S) Serine UAU (Tyr/Y) Tyrosine UGU (Cys/C) Cysteine U UUC UCC UAC UGC C UUA (Leu/L) Leucine UCA UAA[B] Stop (Ochre) UGA[B] Stop (Opal) A UUG UCG UAG[B] Stop (Amber) UGG (Trp/W) Tryptophan G C CUU CCU (Pro/P) Proline CAU (His/H) Histidine CGU (Arg/R) Arginine U CUC CCC CAC CGC C CUA CCA CAA (Gln/Q) Glutamine CGA A CUG CCG CAG CGG G A AUU (Ile/I) Isoleucine ACU (Thr/T) Threonine AAU (Asn/N) Asparagine AGU (Ser/S) Serine U AUC ACC AAC AGC C AUA ACA AAA (Lys/K) Lysine AGA (Arg/R) Arginine A AUG[A] (Met/M) Methionine ACG AAG AGG G G GUU (Val/V) Valine GCU (Ala/A) Alanine GAU (Asp/D) Aspartic acid GGU (Gly/G) Glycine U GUC GCC GAC GGC C GUA GCA GAA (Glu/E) Axit glutamic GGA A GUG GCG GAG GGG G A Các codon A U G đều mã hóa cho methionine và phục vụ như là một vị trí bắt đầu: AUG đầu tiêntrong một vùng mã hóa của mRNA là nơi dịch mã protein bắt đầu.[15] B ^ ^ ^ Cơ sở lịch sử cho việc chỉ định các codon kết thúc là amber, orche và opal(tên ba màu sắc) được mô tả trong tự truyện của Sydney Brenner Brenner S. Một cuộc sống trong khoa học (2001) Published by Biomed Central Limited ISBN 0-9540278-0- 9 xem các trang 101-104 </ ref> và trong một bài viết lịch sử của Bob Edgar.[16]