Le modèle neutraliste de l'évolution moléculaire
La neutralité des mutations
Jusqu’au début des années 60, le microcosme évolutionniste semblait avoir adopté, sous forme de consensus, la théorie synthétique de l’évolution qui donne une place centrale, voire unique, à la sélection naturelle, d’où son nom de « néodarwinisme ». Selon ce modèle, chaque trait d’histoire naturelle d’une espèce, anatomique, morphologique ou encore comportemental, peut être interprété en terme d’adaptation. Au plan génétique, l’hétérozygotie, c’est-à-dire l’existence de deux allèles différents d’un même gène sur les deux chromosomes homologues, était expliquée par plusieurs mécanismes. On pouvait faire intervenir l’existence, non démontrée, d’une interaction entre gènes plus ou moins voisins ayant pour effet de conférer un avantage à cette association. On parlait alors d’épistasie ou renforcement interlocus. Un autre mécanisme invoqué était au contraire l’existence d’un renforcement intralocus qualifié d’hétérosis, de surdominance ou encore de vigueur hybride. Cette situation suppose que la valeur sélective des individus hétérozygotes soit supérieure à celle des homozygotes. Enfin, l’avantage du « rare » était envisagé comme un facteur permettant aux porteurs de caractères, et donc d’allèles, peu fréquents de tirer parti de cette rareté pour trouver des partenaires et de pouvoir ainsi transmettre les allèles en question à la génération suivante. Il faut noter que ces différentes hypothèses sont étayées par des calculs fondés sur la loi de Hardy-Weinberg et ses postulats. Le polymorphisme, c’est-à-dire l’existence de plusieurs allèles d’un même gène au sein des populations, était quant à lui assez mal documenté et ne venait pas perturber le consensus.
Dès le milieu des années 60, le développement de la technique d’électrophorèse a permis la mise en évidence d’un polymorphisme enzymatique très important au sein des populations naturelles. Deux descripteurs sont utilisés pour estimer ce polymorphisme : le taux ¿ »hetérozygotie ou proportion moyenne de loci hétérozygotes par individus et le taux de polymorphisme ou proportion de loci polymorphes dans la population. Un certain nombre ietudes proposent des valeurs pour différents groupes zoologiques : 12% d’hétérozygotie moyenne par locus et environ 30% de loci polymorphes chez Drosophila pseudoobscura, 9% s. 27% respectivement pour la souris (Britton-Davidian 1985), 7% et 28% respectivement chez l’homme (Lucotte 1983). Ces valeurs sont sous-estimées car la technique ne sépare pas peux protéines différentes de même charge et ne permet pas de distinguer deux allèles codant la même protéine du fait de la redondance du code génétique. Pour les autres groupes ~ux et végétaux, Lucotte (1978) donne des valeurs très similaires.
Quoi qu’il en soit, le maintien d’une telle variabilité par sélection naturelle entraîne un ‘ reproductif ou fardeau génétique, c’est-à-dire l’élimination, à chaque génération, d’une ne proportion des descendants, du fait de la variation de valeur sélective due aux muta- Des calculs (pas trop simples) montrent que ce coût de la sélection naturelle est yablement élevé. Nous voudrions juste développer un exemple pour illustrer ce fait. L’existence d’un fardeau de ségrégation pour des allèles surdominants provient du fait chaque génération apparaissent des individus homozygotes dont la valeur sélective est faible que celle des hétérozygotes. Pour un locus biallélique donné, si on appelle j . l. l-s2 les valeurs sélectives respectives des génotypes A,AI; AiA2 et A2A2 avec 20 etï2 > 0, le fardeau de ségrégation dû à ce seul locus polymorphe est égal à sls2/(s1 +si) le détail des calculs, voir Broussal & Viaud 1978 et Lucotte 1983). En admettant, pour fier, que les coefficients de sélection contre les deux génotypes homozygotes sont iden- (i, =s2=i),ona une valeur que l’on peut écrire s/2. Si la surdominance concerne n ~ et si l’on suppose que tous les coefficients de sélection sont à peu près identiques, le farde ségrégation devient alors égal à l-e~s« /2 (Kimura 1990). Une petite application ,ue utilisant des valeurs raisonnables pour s et n (s = 0,01 et n = 2000) nous donne un de ségrégation égal à l-e~10 = 0,9999546. Cela signifie que chaque individu doit 22 000 descendants pour que la population garde un effectif constant. C’est ible pour la plupart des espèces de Vertébrés. Les généticiens sélectionnistes parlent propos d’un « paradoxe du fardeau de ségrégation » (Lucotte 1983) et s’en tiennent là. Pour résoudre ce paradoxe et pour expliquer le polymorphisme observé, le généticien lations M. Kimura, ainsi que d’autres après lui, a proposé l’hypothèse d’une dérive c de mutations neutres ou presque neutres. Cette hypothèse a été baptisée Théorie te de l’Évolution Moléculaire (Kimura 1980, 1990). Elle part du postulat suivant : la majorité des mutations sont neutres du point de vue de la sélection naturelle et aléatoirement jusqu’à fixation ou élimination (Figure 2.11). Le polymorphisme au temps t dans une population, n’est que la vision instantanée de cette dérive plusieurs loci. Ce postulat est remarquablement simple mais s’accompagne d’une que relativement élaborée (pour un naturaliste, évidemment !).
La théorie neutraliste de l’évolution moléculaire n’est pas incompatible avec l’existence d’une sélection naturelle dans la mesure ou elle ne prétend pas que toutes les mutations sont neutres. Il est dit clairement en effet que la neutralité d’une mutation dépend de la contrainte fonctionnelle de la molécule ou région de molécule qu’elle touche. Il est en effet facile de comprendre que toutes les parties d’une protéine n’ont pas la même importance pour sa fonction, le site catalytique d’une enzyme par exemple est assez localisé. La présence d’une mutation dans la région du site actif aura donc plus de conséquences qu’une mutation de même nature située dans une autre région. Cette neutralité dépend également de la localisation des nucléotides affectés (troisième lettre du codon, séquence précurseur, introns, pseudogènes…).
Les horloges moléculaires
Un des résultats centraux de cette théorie est l’existence d’un taux de mutation à peu près constant au cours de l’évolution, ce qui a permis à ses auteurs de parler d’horloge moléculaire. Nous voudrions développer ici succinctement les calculs simples (mais non exempts d’approximations) permettant d’arriver à ce résultat avant de discuter d’un paradoxe soulevé par celui-ci et généralement passé sous silence.
Ces calculs utilisent les substitutions d’acides aminés intervenues dans la famille des globines. Lorsque l’on compare les chaînes de l’hémoglobine de 2 espèces de Vertébrés, on note un certain nombre d’acides aminés différents. Si on appelle daa ce nombre et naa le nombre total d’acides aminés de la séquence comparée, alors le pourcentage d’acides aminés différents est Pd = daa/naa. On constate généralement que plus deux espèces sont éloignées au plan phylogénétique plus Pd est grand. Ce pourcentage ne représente pourtant pas le nombre exact de substitutions d’acides aminés apparues à partir de la séquence ancestrale. En effet, cette séquence est inconnue (même les « fossiles vivants » évoluent) et donc on ne peut discerner 2 mutations affectant un site en même position au sein des 2 lignées comparées. Pd sous-estime donc le taux réel de substitution d’acides aminés au cours de l’évolution moléculaire.
Pour estimer plus précisément ce taux de substitution, on considère que celles-ci suivent la loi statistique de Poisson (ou loi des petits nombres) et que la probabilité qu’il survienne 0, 1,2… substitutions pour 1 site suit la série de Poisson :
e-K-+K„e-K-+{K„ 2/2′)e~K°°+…
avec Kaa le nombre moyen par site de substitutions d’acides aminés.
Pour calculer Kaa, il suffit de dire que la probabilité qu’un site ne subisse aucune substitution est égale d’une part au premier terme de la série, e~K“, et d’autre part à la proportion
d’acides aminés identiques, 1 -Pd. Ceci est vérifié si les taux de substitution sont égaux d’un site à l’autre, ce qui reste à démontrer, ou si ces taux sont très faibles, ce qui est vrai.
On a donc :
e~K-=l-Pd, d’où Kaa = -Logn(-Pd).
Cette relation est valable à condition que Pd reste inférieur à 50%. Pour des valeurs supérieures, on raffine et on prend :
Kaa =-Logn{-Pd-{IS)Pi2).
On peut alors connaître le taux de substitution d’acides aminés par site et par année, en utilisant les données de la paléontologie, kaa = Kaa/2T, avec T le temps écoulé depuis la divergence des deux lignées. On multiplie le dénominateur par deux (on double le temps) car les substitutions se sont produites dans les deux lignées comparées.
Lorsque l’on applique ces calculs à la chaîne a de l’hémoglobine des Vertébrés, on obtient des valeurs de Kaa à peu près alignées (Figure 2.12) avec un kaa correspondant au coefficient de la droite de régression, kaa = 0,9.1(T9 substitution par site et par année. Comme le souligne Kimura, ces points sont raisonnablement proches d’une droite et différents tests statistiques permettent de montrer qu’en effet ils n’en sont pas significativement éloignés. On constate de plus que les chaînes a et p évoluent à peu près à la même vitesse.
Ce tableau, regroupant différentes données établies chez les Mammifères, montre qi existe plusieurs « horloges » qu’on ne peut expliquer qu’à l’aide de la sélection naturelle. PI la pression de sélection exercée sur une protéine est forte, plus kaa est petit. Par exemple, taux d’évolution calculé pour la partie fonctionnelle de la molécule d’insuline est de 0,44.1 ( substitution par site d’acide aminé et par an, alors que pour la chaîne C, excisée lors de maturation de la pro insuline, on obtient un taux de 2,4.10″9 substitution par site et par a Cependant, pour nombre de ces protéines, l’existence d’une quelconque importance de structure pour la réalisation de la fonction n’est pas démontrée mais simplement suggérée p< le faible taux de substitutions que ces protéines présentent d’une lignée à l’autre. Ceci pourra bien ressembler à un raisonnement tautologique, ce qui est d’ailleurs exploité comme argi ment par certains auteurs très critiques vis à vis de l’évolution (Denton 1988).
Ce résultat, généralement bien accepté en ce sens qu’il permet le renforcement d’un discipline naturaliste par un apport de « sciences dures », appelle malgré tout quelque remarques !
En ce qui concerne les séquences comparées, ces analyses ne concernent que les subs titutions et négligent tous les autres types de mutations (inversion, délétion, etc.) qualifiées de lacunes. Or ces lacunes sont de plus en plus importantes quand les espèces comparées sont de plus en plus différentes.
En ce qui concerne le résultat lui-même, il est pour le moins paradoxal car on constate une constance du taux de substitution par site et par année et non pas par génération !
Pour expliquer ce qui semble bien être un fait de l’évolution moléculaire, les neutralistes commencent par démontrer qu’une hypothèse sélectionniste est insoutenable. La génétique des populations (version classique) montre que le taux de substitution des allèles mutants avantageux (k) est proportionnel à Ne la taille efficace de la population (elle-même fonction du nombre de mâles et de femelles reproducteurs), au taux de mutation va et à sa l’avantage sélectif moyen de ces mutants avantageux.
On peut écrire :
k « Ne.va.sa
La probabilité pour que ce produit reste constant est effectivement très faible.
L’hypothèse neutraliste est plus satisfaisante mais aussi plus alambiquée. On suppose en fait que les mutations ne sont pas tout à fait neutres mais légèrement délétères. Dans une population d’effectif petit elles sont neutres alors que dans une population d’effectif grand elles sont contre-sélectionnées. Donc le nombre de mutations effectivement neutres diminue quand la taille de la population augmente. Chez les animaux, quand la taille corporelle augmente, le temps de génération augmente également en même temps que l’effectif de la population diminue. Donc la proportion de mutations neutres augmente chez ces animaux compensant ainsi la diminution du nombre de générations par année. L’interdépendance de ces paramètres conduit à une certaine constance des taux de substitutions. Il faut bien reconnaître malgré tout que cette explication n’est pas complètement lumineuse.
Ridley (1997) propose quant à lui une autre explication en partant du constat que l’indépendance de la vitesse d’évolution moléculaire par rapport au temps de génération ne concerne que les protéines et pas l’ADN. En effet, l’étude du rythme des substitutions nucléotidi- ques montre que celui-ci dépend du temps de génération et qu’il est plus rapide chez les espèces à temps de génération court. Chez ces dernières, le nombre de réplications par unité de temps dans la lignée germinale est supérieur à ce que l’on observe chez les espèces à temps de génération long. La relation entre temps de génération et substitutions nucléotidiques est encore plus net pour les mutations silencieuses. Le tableau ci-dessous présente des estimations de vitesse de telles mutations dans des groupes aux temps de génération contrastés, Primates, Artiodactyles et Rongeurs.
La reconstitution de phylogénies
Dans un premier temps, l’étude des substitutions d’acides aminés dans les enzymes séri- d’espèces apparentées, permet, dans les cas bien documentés, de tester la validité du Me de l’horloge moléculaire. C’est le cas, par exemple, pour les drosophiles des îles aii, déjà évoquées aux chapitres 1.111.2. et 2.III.2. Cet exemple est particulièrement inté- it car les différentes espèces sont confinées à des volcans apparus successivement selon «e nord-ouest/sud-est et datés très précisément par la méthode potassium-argon. On s’in- à un groupe d’espèces, planitibia, constitué de mouches de grande taille peuplant les S humides d’altitude et dont la vitesse de reproduction est assez lente, deux générations su au maximum (Carson 1976).
Un autre exemple que l’on peut donner de l’utilité de ces comparaisons de séquences consiste à étudier un groupe de protéines que l’on peut qualifier d’aquaporines (Chrispeels <fc Maurel 1994). Il s’agit de molécules homologues impliquées dans les échanges membranaires et le contrôle du potentiel hydrique cellulaire. Ces protéines sont constituées de deux sous- unités comportant chacune trois domaines intra-membranaires en hélice. La similitude entre les deux sous-unités est telle que l’on pense que le gène actuel résulte de la duplication d’un gène ancestral (voir chapitre 2.V.3.). Une représentation simplifiée est proposée sur la figure 2.14. On a comparé les séquences de six membres de cette famille protéique : MIP, extraite des fibres du cristallin de bœuf ; NOD, extraite des nodules racinaires de soja ; GLP provenant de la membrane de Escherichia coli ; TIP, provenant du tonoplaste de nombreuses plantes supérieures ; BIB, extraite du système nerveux de la drosophile ; GLY, issue de la membrane de Streptomyces coelicolor (Pao et al. 1991). Les protéines ont été séquencées et ces séquences sont ensuite alignées grâce à un programme informatique qui permet de détecter le maximum de similitude. Les taux de divergence sont ensuite estimés à l’aide de ce même programme, ce qui permet alors de construire l’arbre phylogénétique le plus parcimonieux.
Le premier enseignement que l’on tire de la comparaison de ces différentes séquences est que les procaryotes sont plus éloignés de tous les autres organismes que ces derniers ne le sont entre eux (Figure 2.15). Ce résultat n’est guère surprenant et ne justifie pas à lui seul l’utilisation de méthodes aussi lourdes.
Mais il y a mieux. Lorsque l’on compare non plus les protéines entières mais les sous- unités, on constate que chacune forme une entité évolutive. C’est-à-dire qu’il y a plus de similitudes, par exemple, entre les sous-unités n°l du soja et du bœuf (NOD1 et MIP1) qu’entre les deux sous-unités de chaque molécule (Figure 2.16), soja d’un coté (NOD1 et NOD2) et bœuf de l’autre (MIP1 et MIP2). Cette constatation est même valable lorsque l’on compare Procaryotes et Eucaryotes.
La conclusion de ces observations est que la duplication intragénique, qui a donné naissance à une molécule à six domaines transmembranaires, s’est produite avant la divergence conduisant aux Procaryotes et aux Eucaryotes. On peut ici proposer une datation relative d’un événement génétique important sans avoir recours aux archives fossiles.
Comme on le voit, la Théorie Neutraliste de l’Évolution Moléculaire explique de manière satisfaisante ou presque un certain nombre de faits concernant la variabilité génétique des populations, la divergence interspécifique et les parentés moléculaires. Elle doit être considérée comme un modèle permettant d’étayer les modèles évolutionnistes classiques. Mais cette théorie ne propose pas de mécanisme de spéciation et pour ce qui est de la compréhension des problèmes de l’Evolution des espèces, elle reste donc incomplète.
Vidéo : Le modèle neutraliste de l’évolution moléculaire
Vidéo démonstrative pour tout savoir sur : Le modèle neutraliste de l’évolution moléculaire
https://www.youtube.com/watch?v=8jRW3eItkX0