Comprendre les statistiques en 5 jours

 
  5 jours       2625       Initiation    

  Prochaines sessions et informations pratiques

Objectifs de la formation
  • Maîtriser les concepts de la statistique descriptive afin de comprendre l’information statistique et d’éviter les pièges d’interprétation.
  • Savoir réaliser des traitements simples sur des données et présenter les résultats obtenus à l’aide de tableaux, de graphiques et d’indicateurs numériques.
  • Mesurer la liaison entre deux variables et discerner la pertinence des outils employés ainsi que leurs limites.
  • S’approprier les indicateurs statistiques, de leur construction à leur bonne utilisation, afin de les intégrer dans des communications.
Comprendre les statistiques en 5 jours
Prérequis

Niveau de l’enseignement secondaire en mathématiques et connaissances de base d’Excel


Public visé

Toute personne souhaitant s’initier à la statistique afin d’acquérir un regard critique par rapport aux résultats statistiques


Programme détaillé

Construite à partir d’exemples pratiques, cette formation vise à comprendre, organiser, traiter, analyser et présenter l’information statistique. La formation a une orientation pratique forte, de nombreux exemples et des ateliers seront proposés avec Excel.

Concepts de la statistique

Construction de tableaux statistiques et graphiques associés

Résumé de l’information et choix de l’indicateur de position le plus approprié

  • Moyenne arithmétique, médiane, mode, autres moyennes, l’effet de structure
  • Application : introduction aux indices
  • Quantiles, boîte à moustaches (box-plot)

Dispersion et concentration

  • Caractéristiques de dispersion : variance et écart-type, coefficient de variation, écart absolu médian, étendue, intervalles inter-quantiles
  • Étude de la concentration : courbe de Lorenz, indice de Gini

Atelier

Description et mesure de la liaison entre deux variables

  • Les tableaux de contingence, distributions marginales et conditionnelles, représentations graphiques
  • La statistique du khi-deux et le V de Cramer
  • Le nuage de points, le coefficient de corrélation linéaire, l’ajustement linéaire (droites de régression), le coefficient de corrélation de rang de Spearman
  • Application : introduction aux séries chronologiques
  • Les moyennes et variances conditionnelles, les courbes de régression
  • Le rapport de corrélation, l’analyse de variance à un facteur

Atelier


Les objectifs de cette formation : statistique descriptive univariée et bivariée

 

La statistique descriptive univariée est une branche de la statistique qui vise à résumer, organiser et présenter des données de manière significative. Elle se concentre sur l’analyse d’une seule variable à la fois et comprend les éléments suivants :

Distribution des données : La statistique descriptive permet de visualiser la distribution des données à l’aide d’histogrammes, de boxplots, de diagrammes circulaires, etc.

  • Mesures de tendance centrale : Les mesures de tendance centrale, telles que la moyenne, la médiane et le mode, permettent de décrire où se situe le centre de la distribution des données.

  • Quantiles : Ce sont les valeurs de la variable qui divisent le jeu de données en intervalles contenant le même nombre de données. Les plus utilisés sont les quartiles, les déciles et les centiles (ou percentiles).

  • Mesures de dispersion : Les mesures de dispersion, comme l’écart-type, l’écart interquartile et l’étendue, fournissent des informations sur la variation des données autour de la mesure de tendance centrale.

La statistique bivariée concerne l’analyse de la relation entre deux variables. Elle permet d’explorer les liens et les interactions entre ces variables. Voici quelques éléments clés de la statistique bivariée :

  • Diagramme de dispersion : Le diagramme de dispersion (scatter plot ou nuage de points) est un outil graphique qui représente les données dans le plan cartésien selon deux variables continues. Il permet de visualiser la relation entre les deux variables et d’identifier des schémas ou des tendances.

  • Régression linéaire simple : La corrélation linéaire mesure la relation linéaire entre deux variables continues. Le coefficient de corrélation de Pearson est souvent utilisé pour quantifier cette relation.

  • Tests d’indépendance : Les tests d’indépendance, tels que le test du chi-carré, évaluent s’il y a une association statistiquement significative entre deux variables catégorielles.

  • Analyse de la variance : La décomposition de la variance permet de calculer le rapport de corrélation. Cet indicateur mesure la proportion de la variance qui peut être expliquée par une autre variable pouvant être qualitative.

La statistique bivariée permet donc d’explorer et de comprendre les relations entre deux variables. Elle est utile pour identifier les dépendances, les tendances et les associations, ce qui contribue à une meilleure compréhension des phénomènes étudiés.