| 
           
            | 7- 
              Le code génétique L'ADN 
                est avant tout une information. L'ADN contient, inscrit dans sa 
                structure même, toutes les informations nécessaires 
                à la cellule pour synthétiser les milliers de protéines 
                différentes qui sont nécessaire à sa survie. 
                C'est, en quelque sorte, l'équivalent du disque dur de 
                votre ordinateur. Un disque dur sur lequel on retrouverait des 
                recettes de protéines.  Mais 
                comment une molécule peut-elle constituer une information? 
                Comment cette molécule peut-elle indiquer à la cellule 
                comment synthétiser du lysozyme ou de l'hémoglobine? 
                 Prenons, 
                comme exemple, l'information nécessaire pour synthétiser 
                du lysozyme. On pourrait écrire cette information en représentant 
                chacun des 130 acides aminés de la chaîne par 
                trois lettres de l'alphabet latin. On obtiendrait 
                ceci: 
                 
                  | Le 
                    lysozyme LYS 
                    VAL PHE GLU ARG CYS GLU LEU ALA ARG THR LEU LYS ARG LEU GLY 
                    MET ASP GLY TYR ARG GLY ILE SER LEU ALA ASN TRP MET CYS LEU 
                    ALA LYS TRP GLU SER GLY TYR ASN THR ARG ALA THR ASN TYR ASN 
                    ALA GLY ASP ARG SER THR ASP TYR GLY ILE PHE GLN ILE ASN SER 
                    ARG TYR TRP CYS ASN ASP GLY LYS THR PRO GLY ALA VAL ASN ALA 
                    CYS HIS LEU SER CYS SER ALA LEU LEU GLN ASP ASN ILE ALA ASP 
                    ALA VAL ALA CYS ALA LYS ARG VAL VAL ARG ASP PRO GLN GLY ILE 
                    ARG ALA TRP VAL ALA TRP ARG ASN ARG CYS GLN ASN ARG ASP VAL 
                    ARG GLN TYR VAL GLN GLY CYS GLY VAL
 |  Les 
                trois caractères LYS, par exemple, codent pour l'acide 
                aminé lysine; les caractères VAL 
                codent pour la valine, etc. Cependant, 
                ce code serait inutilisable pour la cellule. On voit difficilement 
                comment on pourrait entrer cette recette faite d'un alphabet latin 
                dans la cellule et comment on pourrait lui apprendre à 
                l'utiliser (à décoder la recette) pour fabriquer 
                du lysozyme.  Pourtant 
                cette recette du lysozyme est bien présente dans chacune 
                de vos cellules. Comme nous le verrons, elle n'est pas écrite 
                avec des lettres de l'alphabet, mais avec des molécules, 
                plus précisément des nucléotides. 
                Les nucléotides forment un code que la cellule peut lire 
                et reproduire. |         |  
           
            | Pour 
              comprendre ce code, utilisons une analogie.
 Supposons que 
                vous voulez écrire un message secret en utilisant des billes 
                de couleur que vous enfilez sur un fil. Vous devez donc faire 
                correspondre des billes à des lettres de l'alphabet. Supposons 
                aussi que vous disposez de seulement quatre couleurs de billes: 
                rouge, jaune, 
                vert et bleu.  On 
                pourrait, par exemple, former un code où chaque bille correspondrait 
                à une lettre de l'alphabet. La jaune, par exemple, pourrait 
                correspondre à la lettre A, la verte à la lettre 
                B, la bleue à la lettre C et la rouge à la lettre 
                D. Vous voyez immédiatement le problème. Notre code 
                ne permettrait que de désigner 4 lettres sur les 26 de 
                l'alphabet. On pourrait écrire BABA (vert-jaune-vert-jaune) 
                ou BAC (vert-jaune-bleu), mais pas BIOLOGIE.
 
  Regroupons 
                les billes deux par deux. Par exemple: bleu-rouge 
                correspondrait à "A", jaune-vert à "B", 
                bleu-bleu à "C" et ainsi de suite. "BABA" s’écrirait alors:
 
 C'est 
                déjà mieux, on a maintenant 16 combinaisons 
                possibles ( 42 ). Malheureusement, 
                ce n'est pas assez puisque l'alphabet comporte 26 lettres.  Regroupons 
                alors les billes par trois. Par exemple, décidons 
                que les trois billes jaune-bleu-rouge représentent 
                la lettre A, bleu-jaune-vert 
                la lettre B, jaune-rouge-rouge la 
                lettre C et ainsi de suite jusqu'à Z. 
                Avec des combinaisons de trois billes, on peut former 64 
                combinaisons différentes ( 43 ), 
                c’est plus que ce qui est nécessaire pour coder 26 
                lettres. On pourrait ainsi rédiger un message en enfilant 
                des billes de couleur sur un fil.
 « 
                BABA » s’écrirait en enfilant dans l’ordre, 
                les billes: 
 |  |  
           
            | Quiconque 
                connaît le code utilisé pourrait lire le message 
                en regardant la succession des billes de couleur formant le chapelet. 
                La séquence des billes constitue un message codé. 
                Sauriez-vous, avec ce code, écrire « BAC »? Plutôt 
                qu’utiliser des billes, utilisons quelque chose de beaucoup, 
                beaucoup plus petit, des nucléotides. 
                Il y a quatre sortes de nucléotides, A, 
                T, C et G. 
                Lions ces nucléotides les uns aux autres comme les billes 
                de couleur de l'exemple précédent. On pourrait imaginer 
                un code où chaque groupe de trois nucléotides correspondrait 
                non pas à une lettre de l’alphabet (la cellule n’a 
                que faire de l’alphabet romain) mais à 
                un des 20 acides aminés formant les protéines. 
                On pourrait ainsi former des messages correspondant à 
                la recette d’une protéine. 
                 
                  | Convenons, 
                    par exemple, que les trois nucléotides A-A-A 
                    représentent l’acide aminé phénylalanine, 
                    G-A-C représentent 
                    la leucine, T-C-T 
                    l’arginine et ainsi de suite. | A-A-A 
                      = PHEG-A-C = LEU
 T-C-T = ARG
 |  La protéine formée des cinq acides aminés 
                 Phé-Arg-Leu-Phé-Leu 
                pourrait être représentée 
                (codée) par la chaîne formée des nucléotides:
 
 On 
                aurait ainsi une molécule (un polymère de 
                nucléotides) qui représenterait, sous forme 
                codée, la recette d’une protéine. On pourrait 
                aussi mettre « bout à bout », des milliers 
                de recettes différentes. Eh bien, l'ADN d'un chromosome, 
                c’est exactement ça!  Imaginez 
                chaque chromosome comme une longue, une très longue succession 
                de nucléotides, un chapelet pouvant avoir une centaine 
                de millions de perles. Chaque groupe successif de trois nucléotides 
                désigne un acide aminé selon un code préétabli 
                connu par les cellules et chaque recette de protéine constitue 
                un gène. 
                 C'est 
                au début des années 60 qu'on a réussi à 
                trouver le code (nous verrons plus loin comment) : Le 
                code génétique |  
                
                  
                    | Dans 
                        l'exemple des billes, c'est moi qui ai arbitrairement 
                        décidé du code. J'ai fait correspondre, 
                        par exemple, les billes jaune-bleu-rouge à la lettre 
                        A. J'aurais pu utiliser une autre combinaison.  Mais 
                        dans le cas du code génétique, "qui" 
                        ou "quoi" a décidé du code ? 
                        Pourquoi est-ce AAA qui code pour la phénylalanine 
                        et non une autre combinaison de nucléotides? Actuellement 
                        on ne le sait pas. On imagine que le code s’est 
                        formé au tout début de l’histoire 
                        de la vie, il y a plus de trois milliards d’années. 
                        Mais on ne peut absolument pas expliquer pourquoi c’est 
                        ce code (celui que vous pouvez voir en cliquant sur le 
                        lien à gauche) qui a été retenu par 
                        la nature.  Peut-être 
                        que plusieurs codes différents se sont même 
                        formés au tout début de la vie. Mais même 
                        si ça a été le cas, il n'en reste 
                        plus qu'un aujourd'hui, celui que vous pouvez observer 
                        en cliquant sur le lien à gauche. Ce code est dit 
                        universel, 
                        il est le même pour tous les êtres vivants. Si 
                        la vie existe ailleurs dans l’univers, on ne sait 
                        pas si elle est basée, comme la nôtre, sur 
                        une information génétique faite d’ADN 
                        et, si c’est le cas, si le code est le même 
                        que le nôtre. 
 |  |  
          
            |   Voyez, 
                par exemple, la 
                séquence de nucléotides codant pour 
                les acides aminés de la calmoduline, 
                une enzyme intervenant dans la régulation de l'activité 
                de plusieurs enzymes. Bien 
                sûr, l'ADN est constitué de deux chaînes 
                complémentaires. L'information n'est portée que 
                par une des deux chaînes, parfois l'une, parfois l'autre. 
                La chaîne complémentaire au message est là 
                pour stabiliser la molécule et lui permettre de se reproduire 
                (réplication). Le 
                segment d'ADN correspondant à la recette d'une protéine 
                est appelé gène. Le segment d'ADN 
                ci-dessous correspond donc au gène de la protéine 
                PHE-ARG-LEU-PHE-LEU 
 Gène 
                de la protéine PHE-ARG-LEU-PHE-LEU. 
                L'information est portée par le brin du bas (et elle se 
                lit dans la direction 3' - 5' ). Le brin du haut 
                sert à stabiliser la molécule et lui permet de se 
                reproduire. L'ADN 
                constitue donc une information miniaturisée (le minuscule 
                noyau d'une cellule peut contenir des dizaines de milliers de 
                gènes différents). Et le plus beau de l'histoire, 
                c'est que cette information peut en plus se reproduire ! |  |  
           
            | 
                 Attention, 
                  le segment d'ADN codant pour la cystéine (CYS), ce n'est 
                  pas de la cystéine, pas plus que le mot "pomme" 
                  n'est une pomme.
 Le 
                  triplet de nucléotide ACG désigne 
                  la cystéine, ce n'en est pas! Voir 
                  : La 
                  structure de l'ADN et le code génétique (cliquez 
                  sur "Codon", le dernier bouton à droite).   
                   
                    | Et 
                        si on mettait tout ça en musique?Transcriptions 
                        The Music of Protein Sequences
 Des 
                        biologistes à l'esprit musical ont eu l'idée 
                        de mettre les protéines en musique. Ils ont assigné 
                        une note de musique à chacun des vingt acides aminés 
                        de sorte que la séquence de la protéine 
                        devienne la partition de la pièce musicale. La 
                        durée de la note est déterminée par 
                        le nombre de triplets d'ADN codant pour l'acide aminé 
                        correspondant. Par moment, une harpe accompagne la note 
                        en jouant des notes correspondant aux nucléotides 
                        codant pour l'acide aminé. Les structures secondaires 
                        de la protéine (hélices alpha ou feuillets 
                        bêta) correspondent à des notes jouées 
                        par des instruments d'accompagnement. Les régions 
                        hydrophobes ou hydrophiles peuvent aussi intervenir. Enfin, 
                        consultez cette page 
                        du site pour plus de détails sur les règles 
                        musicales appliquées et pour écouter quelques 
                        exemples. Le résultat est assez étonnant! 
                        
 Plusieurs autres protéines musicales sur 
                        cette page.
 |  Évitez 
                  une erreur fréquente, souvent vue dans les journaux : 
                  ne confondez pas code génétique et information 
                  génétique. Le code génétique, 
                  c'est la correspondance entre un triplet de nucléotides 
                  et un acide aminé. Ce code est le même pour tous 
                  les êtres vivants. L'information génétique, 
                  c'est la séquence des nucléotides, les recettes 
                  de protéines. L'information génétique n'est 
                  pas la même d'un être vivant à l'autre (sauf 
                  les clônes comme les jumeaux identiques). | 
                 
                  | Un 
                      gène = l'information complète, sous 
                      forme d'ADN, nécessaire pour synthétiser une 
                      protéine. Ex. 
                      gène 
                      du lysozyme, gène du collagène, gène 
                      de l'insuline, etc. Cette 
                      définition n'est pas tout à fait exacte comme 
                      nous le verrons plus loin. On 
                      ignore le nombre total de gènes contenus dans le 
                      génome humain. Les dernières estimations avancent 
                      un chiffre variant entre 30 000 et 40 000. Certains 
                      auteurs croient qu'il y en aurait plus. Ces gènes 
                      ne représentent qu'environ 1% du total de l'ADN du 
                      génome. 3% correspondrait à des séquences 
                      qui contrôlent l'expression des gènes. Le 96% 
                      restant n'a pas de rôle dans la synthèse des 
                      protéines. Une partie joue un rôle dans le 
                      repliement et la séparation des chromosomes au cours 
                      de la division cellulaire et ce qui reste ne semble pas 
                      avoir de fonction (nous y reviendrons).
 À lire et à visionner:
 Le génome au propre
 
  Un 
                      document tiré de l'émission Découverte 
                      de Radio-Canada. Visionnez le reportage vidéo (cliquez 
                      sur l'icône au bas de la page) |      Combien 
                de nucléotides  contiendrait 
                un gène codant pour une protéine de 100 acides aminés? |  © 
          Gilles Bourbonnais / Cégep de Sainte Foy  |