σ = 0 rime avec perfection
Si toutes les valeurs sont identiques, σ tombe à zéro. Dans ce cas, impossible de définir des z-scores : il n'y a aucune dispersion.
Astuce : après calcul, utilisez x→z et z→x pour vos conversions ponctuelles.
Moyenne : \( \bar{x} = \dfrac{1}{N}\sum_{i=1}^{N} x_i \)
Variance population : \( \sigma^2 = \dfrac{1}{N}\sum (x_i - \bar{x})^2 \), Écart type : \( \sigma = \sqrt{\sigma^2} \)
Variance échantillon : \( s^2 = \dfrac{1}{N-1}\sum (x_i - \bar{x})^2 \), Écart type : \( s = \sqrt{s^2} \)
Z-score (avec σ choisi) : \( z = \dfrac{x - \bar{x}}{\sigma} \)
Si σ = 0 (toutes les valeurs égales), les z-scores ne sont pas définis. Nous l'indiquons sans alarme 😌.
L'écart type mesure la dispersion des données autour de la moyenne. Un σ faible signifie que la plupart des valeurs sont proches de la moyenne ; un σ élevé indique des données plus étalées.
Un z-score indique de combien d'écarts types une valeur se situe au-dessus ou au-dessous de la moyenne : \( z = \dfrac{x-\bar{x}}{\sigma} \). Pour une distribution normale, on retrouve la règle 68–95–99,7.
Si \( \bar{x}=70 \) et \( \sigma=4 \), alors pour \( x=76 \), \( z=(76-70)/4=1,5 \) — environ le 93e percentile sous un modèle normal.
Associez les z-scores aux percentiles avec la CDF normale (ex. z=0 → 50e, ±1 → 84e/16e, ±2 → 97,5e/2,5e).
Si toutes les valeurs sont identiques, σ tombe à zéro. Dans ce cas, impossible de définir des z-scores : il n'y a aucune dispersion.
L'erreur d'échantillonnage diminue souvent avec 1/√N. Doubler la taille de l'échantillon réduit l'erreur standard d'environ 30 %.
Dans une courbe normale, environ 5 % des points se situent au-delà de ±2σ. Les valeurs extrêmes existent naturellement : le contexte décide si elles sont problématiques.
On peut additionner des z-scores indépendants (comme somme quadratique) pour l'incertitude combinée : \(z_\text{total} = \sqrt{z_1^2 + z_2^2}\).
Choisir σ échantillon (N−1) ou σ population (N) change chaque z. Fixez le diviseur avant d'interpréter les scores.