Sondages avec R

 
  2 jours       1080       Avancé    

  Prochaines sessions et informations pratiques

Formation langage R
Objectifs de la formation

Savoir mettre en œuvre avec le logiciel R des méthodes classiques d’échantillonnage, d’estimation, de calcul de précision, de redressement et de traitement de la non-réponse.

Sondages avec R
Prérequis

Connaissance des méthodes d’échantillonnage et d’estimation en sondage. Quelques notions sur le logiciel R sont préférables (formation R Initiation).


Public visé

Concepteurs et responsables d’enquêtes statistiques souhaitant exploiter le langage R


Programme détaillé

La formation s’articule autour de trois axes : des rappels en sondage, les fonctions utiles en R et des mises en pratique.

La formation est axée sur l’utilisation des principaux packages de traitement de données d’enquête, tels que Sampling, développé par Yves Tillé et Alina Matei, le package ICARUS permettant de faire des calages sur marge. La formation met l’accent sur la mise en pratique et de ce fait, une connaissance, même sommaire, du logiciel R serait préférable. Par ailleurs, les notions théoriques en sondage seront rappelées brièvement.

Les méthodes d’échantillonnage

  • Méthode du Cube
  • Sondage aléatoire simple
  • Sondage systématique
  • Sondage à probabilités inégales
  • Sondage stratifié
  • Sondage à deux degrés
  • Sondage équilibré spatialement

Les méthodes d’estimation et de redressement

  • Estimateur de Horvitz-Thompson
  • Estimateur post-stratifié
  • Estimateur par le ratio
  • Estimateur par la régression et estimateur par le calage

Les méthodes de calcul de précision

Les méthodes de traitement de la non-réponse


Principaux packages R utilisés pour traiter des données de sondages

 

Lorsqu’il s’agit de traiter des sondages avec le langage R, il existe plusieurs packages qui offrent des fonctionnalités spécifiques pour l’analyse des données d’enquête. Voici quelques-uns des principaux packages utilisés dans ce contexte :

  • survey : Ce package est l’un des plus utilisés pour l’analyse des données d’enquête. Il fournit des outils pour effectuer des estimations statistiques pondérées, des analyses de redressement, des calculs de variance, des comparaisons entre groupes, etc. Il prend en charge différentes méthodes d’échantillonnage, de redressement et de gestion des poids d’enquête.

  • srvyr : Ce package est une extension du package “survey” qui facilite l’utilisation de la syntaxe de la grammaire des données (“tidyverse”) pour les analyses d’enquête. Il permet d’effectuer des manipulations de données, des agrégations, des visualisations et des analyses statistiques en utilisant une approche basée sur les pipes (fonction %>%).

  • anesrake : Ce package fournit des outils pour effectuer des analyses de redressement (raking) dans le cadre d’enquêtes. Il permet de calculer des poids de redressement optimaux en utilisant des variables auxiliaires et de les appliquer aux données de l’enquête pour obtenir des estimations plus précises.

  • sampling : Ce package propose des fonctions pour effectuer différentes méthodes d’échantillonnage, telles que l’échantillonnage aléatoire simple, l’échantillonnage stratifié, l’échantillonnage par grappes, etc. Il permet également de calculer des estimations pondérées et de réaliser des analyses statistiques sur les données d’enquête.

  • surveydata : Ce package fournit des fonctionnalités pour manipuler et analyser des données d’enquête complexes. Il facilite le traitement des plans d’échantillonnage complexes, des poids de redressement, des clusters, des strates, etc. Il offre également des outils pour calculer des statistiques descriptives, des estimations pondérées et des intervalles de confiance.

NB : cette liste n’est bien sûr pas exhaustive !