Le code génétique
Chaque groupe de trois nucléotides correspond à un acide aminé
La première lettre de chaque triplet correspond à l'extrémité 3' du brin d'ADN
et la dernière à l'extrémité 5' .

AAA
Phénylalanine
AGA
Sérine
ATA
Tyrosine
ACA
Cystéine
AAG
Phénylalanine
AGG
Sérine
ATG
Tyrosine
ACG
Cystéine
AAT
Leucine
AGT
Sérine
ATT
STOP
ACT
STOP

AAC
Leucine

AGC
Sérine
ATC
STOP
ACC
Tryptophane
GAA
Leucine
GGA
Proline
GTA
Histidine
GCA
Arginine
GAG
Leucine
GGG
Proline
GTG
Histidine
GCG
Arginine
GAT
Leucine
GGT
Proline
GTT
Glutamine
GCT
Arginine
GAC
Leucine
GGC
Proline
GTC
Glutamine
GCC
Arginine
TAA
Isoleucine
TGA
Thréonine
TTA
Asparagine
TCA
Sérine
TAT
Isoleucine
TGG
Thréonine
TTG
Asparagine
TCG
Sérine
TAG
Isoleucine
TGT
Thréonine
TTT
Lysine
TCT
Arginine
TAC
Méthionine
TGC
Thréonine
TTC
Lysine
TCC
Arginine
CAA
Valine
CGA
Alanine
CTA
Ac. aspartique
CCA
Glycine
CAT
Valine
CGG
Alanine
CTG
Ac. aspartique
CCG
Glycine
CAG
Valine
CGT
Alanine
CTT
Ac. glutamique
CCT
Glycine
CAC
Valine
CGC
Alanine
CTC
Ac. glutamique
CCC
Glycine

Le code aurait aussi pu être écrit en utilisant l'autre brin d'ADN (ça revient au même car l'autre brin est en fait la copie en négatif du premier). Le code se lirait alors dans la direction 5' - 3'). Ci-haut, c'est 3'-GAC-5' qui code pour la leucine. On aurait aussi pu écrire que c'est 5'-CTG-3' qui code pour la leucine. C'est la convention utilisée dans le code illustré ci-dessous.

C'est également cette convention qui a été utilisée sur cette page montrant la séquence du gène de la calmoduline.

 

Notez que trois triplets ne codent pas pour un acide aminé. Ils correspondent à un signal d'arrêt, c'est à dire qu'ils indiquent la fin de la recette. Tous les gènes se terminent donc par un de ces triplets STOP (ATT, ACT ou ATC).

Notez également que le code est redondant. C'est à dire que plusieurs combinaisons de trois lettres peuvent désigner le même acide aminé. Ainsi, GCA, GCG, GCT, GCC, TCT et TCC codent tous pour l'arginine.

Pour cette raison, le code génétique est dit dégénéré.

Notez que généralement, lorsque plusieurs triplets codent pour le même acide aminé, il n'y a que la troisième lettre qui varie de l'un à l'autre.

Quelle protéine serait codée par le brin d'ADN :

G A A G T G T T G A C A A A A

 

Sur ce brin d'ADN, on pourrait dire que c'est 3'-GAC-5' qui code pour la leucine.
On peut aussi dire que c'est 5'-CTG-3' qui code pour la leucine.