Les bases des statistiques à deux variables
Quand tu as deux séries de données liées, tu peux les représenter graphiquement sous forme d'un nuage de points. Chaque point a des coordonnées Hi(xi, yi) qui correspondent aux valeurs des deux variables.
Le point moyen G du nuage se situe aux coordonnées (x̄, ȳ), où x̄ et ȳ sont les moyennes respectives de chaque variable. C'est comme le "centre de gravité" de ton nuage de points.
Pour mesurer la dispersion d'une série, tu calcules sa variance V(x), qui représente la moyenne des écarts au carré par rapport à la moyenne. L'écart-type σ(x) est simplement la racine carrée de la variance - c'est plus pratique car il s'exprime dans la même unité que tes données.
La covariance mesure comment deux variables varient ensemble. Si elle est positive, les variables augmentent ensemble ; si elle est négative, quand l'une augmente, l'autre diminue. La droite des moindres carrés est la droite qui s'ajuste le mieux à ton nuage de points.
💡 Astuce : La covariance peut se calculer de deux façons équivalentes - utilise la formule simplifiée pour gagner du temps !