L’étude quantitative de la variation : La biométrie 

Introduction

La génétique mendélienne s’intéresse essentiellement à des caractères qualitatifs (couleurs des yeux, forme de la graine, albinisme … etc). Or on trouve de nombreux caractères quantitatifs qui font généralement référence à des caractères mesurables (mesure en kg, en m, en l, …), comme la taille des individus, poids, pression artérielle, taux de cholestérol, glycémie, nombre de soies de l’abdomen de la drosophile … Certains de ces caractères peuvent avoir un intérêt économique, comme par exemple, la production laitière, la teneur en huile chez les espèces végétales, la taille, le poids, la croissance …

Pour comprendre la variation de ces caractères quantitatifs, on utilise des méthodes et des études statistiques: c’est la biométrie.

1 – L’étude de la variation discontinue

On parle d’une variation discontinue lorsque la variable prend des valeurs exprimées par des nombres entiers.

Exemple: le tableau suivant montre le nombre des nouveau-nés après chaque grossesse chez une population de 100 souris:

Variable (xi): nombre des nouveau-nés

1

2

3

4

5

6

7

8

9

Effectif (ni): nombre des femelles

2

8

12

16

23

18

10

7

1

On représente graphiquement les résultats sous forme de diagramme en bâtons.

On relie les points du sommet des traits verticaux par des segments de droites pour obtenir le polygone de fréquence.

En régularisant manuellement les contours du polygone de fréquence, on obtient la courbe de fréquence.

Application:

Le tableau suivant montre le nombre des grains dans les gousses des haricots:

Variable (Xi): nombre des grains

2

3

4

5

6

7

8

9

10

11

Effectif (ni): nombre des gousses 

3

8

10

20

26

35

22

9

5

2

1- Déterminez le type de variation étudiée. Justifiez votre réponse

2- Réalisez le diagramme en bâtons et polygone de fréquences.

1 – Il s’agit d’une variation discontinue car la variable prend des valeurs exprimées par des nombres entiers.

2 –

2 – L’étude de la variation continue

On parle d’une variation continue lorsque la variable peut prendre toutes les valeurs possibles dans un intervalle donné.

Exemple: Le tableau suivant montre la quantité de lait produite en kg par jours chez une population de 50 vaches 

Variable (Xi): quantité de lait

 [13-16[

[16-19[

[19-22[

[22-25[

[25-28[

[28-31[

[31-34[

[34-37[

[37-40[

Effectif (ni) : nombre de vaches 

2

6

8

12

10

5

4

2

1

On représente graphiquement les résultats sous forme d’histogramme et de polygone de fréquence.

Application:

Le tableau suivant montre la longueur des gousses chez le petit pois:

        

Variable (Xi): classes de longueur en mm

40-49

50-59

60-69

70-79

80-89

90-99

100-109

Effectif (ni) : nombre de gousses

7

47

179

172

79

49

9

1- Déterminez le type de variation étudiée. Justifiez votre réponse

2- Réalisez l’histogramme et le polygone de fréquence de la distribution de la longueur des gousses.

1 – Il s’agit d’une  variation continue car la variable prend toutes les valeurs possibles dans un intervalle donné.

2 – 

La représentation graphique reste insuffisante pour décrire une distribution de fréquence. On aura besoin d’autres paramètres mathématiques et des méthodes statistiques pour définir les caractéristiques d’une distribution de fréquence.

3 -Les paramètres caractéristiques d’une distribution de fréquence 

1- 1- Paramètres de position :

Il s’agit de paramètres qui caractérisent la répartition des mesures par rapport aux valeurs centrales.

       a– Le mode :

Il est la valeur de la classe (sur l’axe des abscisses) dont l’effectif est le plus grand (sur l’axe des ordonnées).

Il permet de déterminer l’homogénéité de la distribution d’une variable :

  • Si le polygone de fréquence est unimodale, on peut supposer que l’échantillon étudié est homogène.
  • Si le polygone de fréquence est bimodale ou plurimodale, l’échantillon étudié est hétérogène.

        b– La moyenne arithmétique:

    On utilise la formule suivante:

  • xi: la valeur de la variable (dans une variation discontinue) ou le centre de la classe ( dans une variation continue).
  • ni : l’effectif de la variable.
  • N: le nombre total d’individus dans la population étudiée.

Il se peut qu’une variable ait la même moyenne dans deux distributions, mais les valeurs se présentent avec des dispersions différentes.

Donc la moyenne arithmétique est insuffisante pour décrire la distribution d’un caractère quantitatif. On aura recours à des paramètres de dispersion.

Application:

Le tableau suivant montre la longueur des gousses chez le petit pois:

        

Variable (Xi): classes de longueur en mm

40-49

50-59

60-69

70-79

80-89

90-99

100-109

Effectif (ni) : nombre de gousses

7

47

179

172

79

49

9

1- Déterminez le mode.

2- Calculez la moyenne arithmétique.

1 – 65 mm

2 – 73.33 mm

1- 2- Paramètres de dispersion :

a– L’écart moyen arithmétique:

C’est la somme des valeurs absolues des écart par rapport à la moyenne arithmétique, multiplier par l’effectif correspondant et diviser par l’effectif total de la population. Il se calcule par la formule suivante :

 Xi: valeur de la variable étudiée correspondant à la classe de rang i.

X̅: moyenne arithmétique.

 ni: l’effectif correspondant à la classe de rang i.

Σ: total.

N : nombre total d’individu.

 b- La variance (V):

Elle désigne la mesure de la dispersion des valeurs par rapport à la moyenne. Et se calcule par la formule suivante :

c – L’écart type (σ)

L’écart type est défini comme la racine carrée de la variance et se calcule par la formule suivante:

σ= √V

Plus l’écart type est petit, plus la variation est faible ( moins dispersée) et plus la population est homogène.

On utilise l’écart type et la moyenne arithmétique pour définir ce qu’on appelle le domaine de confiance.

→ Dans l’intervalle [X̅-σ ; X̅+σ] : On trouve  68% des individus de la population ;

→ Dans l’intervalle [X̅-2σ ; X̅+2σ] : On trouve 95,4% des individus de la population ;

d- Le coefficient de variation:

Le coefficient de variation (CV) est le rapport de l’écart-type à la moyenne. Il se calcule selon la formule suivante:

Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande.

Application:

Le tableau suivant montre la distribution du poids des fruits chez les tomates:

        

Variable (Xi): le poids en g

[75-85[

[85-95[

[95-105[

[105-115[

[115-125[

[125-135[

 

Effectif (ni) : nombre de fruits

6

22

45

30

20

5

 

1- Déterminez le type de variation étudiée. Justifiez votre réponse

2- Calculez les paramètres suivants :

    a – La moyenne arithmétique

    b – La variance

    c – L’écart type

    d – Le coefficient de variation 

3 – Que peut on déduire ?

1 – Il s’agit d’une  variation continue car la variable prend toutes les valeurs possibles dans un intervalle donné.

2 – 

4 – La sélection et la notion de race pure.

Le document 1 représente les résultats d’étude biométrique de la masse des graines chez une population d’haricots.

document 1

On sélectionne deux échantillons de cette population:

  • La première avec des graines légères (20-25)
  • La deuxième avec des graines lourdes (85-90)

 On cultive séparément les graines de chaque classe. Après la germination, on laisse les plantes s’autoféconder. On obtient deux populations (P1 et P2) de graines dont les distributions sont résumées dans les tableaux du document 2:

document 2

1- En exploitant le document 1, déterminez si la distribution du variable est l’homogène ou hétérogène.

2- En utilisant le Document 2. représentez sur le même graphe les distributions des deux populations P1 et P2. 

3 – Que peut on déduire de l’exploitation du graphe obtenu?

1 – On observe que le polygone des fréquences est unimodal, donc on peut supposer que la distribution du variable est homogène. 

2 – Les polygones des fréquences

3 – On observe la présence de deux polygones de fréquence avec deux modes distincts et différents avec le mode de la population initiale. On déduit que la population d’origine était composée de deux sous populations différentes mais non détectables par l’étude statistique de la variation mais qu’on a pu mettre en évidence grâce à la sélection artificielle.

Dans ce cas la sélection a été efficace car on a obtenu deux sous populations différentes.

Pour déterminer si les deux population P1 et P2 sont homogène, on refait la même expérience sur chaque population. 

  • Si on obtient un même mode que celui de la population sélectionnée, on dit que la sélection est inefficace. Et la population est constituée de race pure. 
  • Si on obtient deux modes différents de celui de la population sélectionnée, on dit que la sélection est efficace. Et la population est constituée de races différentes.