1
agregat_statistique
medina5 edited this page 2025-09-09 07:55:38 +02:00

Agrégats statistiques

Les aggrégats statistiques fonctionnent suivant 2 modes soit sur la pouplation totale (POP) soit sur des échantillons (SAMP) restreints.

Variance et écart type

VAR_POP et VAR_SAMP calculent la variance, soit la dispersion des valeurs autour de la moyenne.

STDDEV_POP et STDDEV_SAMP calculent l'écart-type (racine carrée de la variance).

Corrélation

Les fonctions de covariance COVAR_POP(x, y) et COVAR_SAMP(x, y) mesurent comment deux colonnes varient ensemble.

la fonction corr calcule le oefficient de corrélation linéaire de Pearson.

  • Proche de 1 → forte corrélation positive
  • Proche de 0 → pas de relation linéaire
  • Proche de -1 → forte corrélation négative

Médiane et percentiles

percentile_cont(fraction) within group (order by expr)

Calcule le quantile de manière continue (avec une interpolation des valeurs si besoin).

fraction est entre 0 et 1 :

  • 0.25 → premier quartile
  • 0.5 → médiane
  • 0.75 → troisième quartile

En statistique, un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population. Le quartile fait partie des quantiles.

Agrégats de répartition

MODE() WITHIN GROUP (ORDER BY expr)

Retourne la valeur la plus fréquente.