Économétrie 2 : approfondissements
Prochaine session
2, 3, 4 décembre 2024
Prochaines sessions et informations pratiques
Mettre en œuvre des méthodes simples pour mener à bien des études quantitatives qui nécessitent d’estimer des modèles.
Mettre en œuvre des méthodes simples pour mener à bien des études quantitatives qui nécessitent d’estimer des modèles.
Connaissances en statistique inférentielle (formation Statistique inférentielle : estimation ponctuelle, intervalle de confiance et test statistique) et bonnes notions d’économétrie (formation Econométrie 1)
Connaissances en statistique inférentielle (formation Statistique inférentielle : estimation ponctuelle, intervalle de confiance et test statistique) et bonnes notions d’économétrie (formation Econométrie 1)
Data analysts, chargés d’études statistiques, data scientists.
Data analysts, chargés d’études statistiques, data scientists.
Après des rappels sur le modèle linéaire classique dans une perspective prédictive, on présente deux extensions fondamentales. Une première traite de l’estimation robuste en présence d’hétéroscédasticité et/ou d’autocorrélation. Bien souvent, l’objectif des études quantitatives est d’établir et de mesurer des rapports de cause à effet : augmenter les dépenses de campagne publicitaire permet-il d’augmenter ses parts de marché ? Taxer les cigarettes réduit-il de façon significative le tabagisme ? La régression linéaire est souvent insuffisante pour répondre à ce type de questions. Une seconde partie est donc consacrée au problème de l’inférence causale. Les stagiaires mettent en pratique, de façon progressive, sur logiciel, les méthodes présentées au travers d’études concrètes. Les applications sont menées à partir des logiciels R et/ou STATA. Les stagiaires peuvent réaliser les exercices avec le logiciel de leur choix (Stata, R, SAS).
Introduction : retour sur le modèle linéaire classique
Estimations robustes
- Situations concrètes d’hétérosédasticité et d’autocorrélation
- Effets sur la précision des estimateurs des MCO
- Tests et estimations en présence d’hétéroscédasticité
- Exemples et applications
Inférence causale
- Régression et causalité
- L’importance du choix des variables de contrôle
- Situations où la régression ne permet pas d’identifier des relations causales
- Exemples et applications
Identification et estimation à l’aide de variables instrumentales
- L’estimateur de Wald
- La méthode dans le cas général : Estimateur des doubles moindres carrés
- Tests de spécifications
- Problèmes d’inférence : les VI dans la pratique
- Exemples et applications
Après des rappels sur le modèle linéaire classique dans une perspective prédictive, on présente deux extensions fondamentales. Une première traite de l’estimation robuste en présence d’hétéroscédasticité et/ou d’autocorrélation. Bien souvent, l’objectif des études quantitatives est d’établir et de mesurer des rapports de cause à effet : augmenter les dépenses de campagne publicitaire permet-il d’augmenter ses parts de marché ? Taxer les cigarettes réduit-il de façon significative le tabagisme ? La régression linéaire est souvent insuffisante pour répondre à ce type de questions. Une seconde partie est donc consacrée au problème de l’inférence causale. Les stagiaires mettent en pratique, de façon progressive, sur logiciel, les méthodes présentées au travers d’études concrètes. Les applications sont menées à partir des logiciels R et/ou STATA. Les stagiaires peuvent réaliser les exercices avec le logiciel de leur choix (Stata, R, SAS).
Introduction : retour sur le modèle linéaire classique
Estimations robustes
- Situations concrètes d’hétérosédasticité et d’autocorrélation
- Effets sur la précision des estimateurs des MCO
- Tests et estimations en présence d’hétéroscédasticité
- Exemples et applications
Inférence causale
- Régression et causalité
- L’importance du choix des variables de contrôle
- Situations où la régression ne permet pas d’identifier des relations causales
- Exemples et applications
Identification et estimation à l’aide de variables instrumentales
- L’estimateur de Wald
- La méthode dans le cas général : Estimateur des doubles moindres carrés
- Tests de spécifications
- Problèmes d’inférence : les VI dans la pratique
- Exemples et applications
L'économétrie au-delà du modèle linéaire classique
Au-delà du modèle linéaire classique, l’économétrie propose une gamme de méthodes avancées pour analyser les données économiques. Voici quelques-unes de ces méthodes dont certaines seront abordées lors de la formation :
Modèles à variables instrumentales : Ces modèles sont utilisés lorsque les variables explicatives peuvent être endogènes, c’est-à-dire qu’elles sont corrélées avec les erreurs de régression. Les variables instrumentales sont des variables exogènes qui sont corrélées avec les variables explicatives endogènes, mais qui ne sont pas directement corrélées avec les erreurs de régression. Les techniques d’estimation des variables instrumentales, telles que la méthode des moindres carrés en deux étapes (2SLS) et la méthode du maximum de vraisemblance généralisée (GMM), permettent de surmonter le biais résultant de l’endogénéité.
Modèles à effets fixes et effets aléatoires : Ces modèles sont utilisés pour prendre en compte l’hétérogénéité non observée entre les individus ou les unités d’observation. Les modèles à effets fixes permettent de capturer les différences individuelles constantes dans le temps, tandis que les modèles à effets aléatoires permettent à ces différences de varier au fil du temps. Ces modèles sont souvent utilisés dans les données de panel où les individus sont suivis sur plusieurs périodes.
Modèles de séries temporelles : Les modèles de séries temporelles sont utilisés pour analyser les données qui évoluent dans le temps. Ils incluent des modèles autorégressifs (AR), des moyennes mobiles (MA), des modèles ARMA (autorégressifs à moyenne mobile), des modèles ARIMA (autorégressifs intégrés à moyenne mobile) et des modèles ARCH/GARCH (autorégressifs conditionnels hétéroscédastiques généralisés). Ces modèles sont utilisés pour capturer la structure temporelle, les tendances et les motifs cycliques dans les données économiques.
Modèles de choix discret : Ces modèles sont utilisés pour analyser des situations où les variables dépendantes sont qualitatives ou discrètes, par exemple, lors de l’analyse des choix de consommation, de participation au marché du travail, de décisions d’investissement, etc. Les modèles de choix discret, tels que le modèle probit, le modèle logit, le modèle multinomial, etc., permettent de modéliser et d’estimer les probabilités de différentes alternatives.
Modèles de données de panel dynamiques : Ces modèles sont utilisés pour analyser des données de panel où les variables évoluent dans le temps et sont interdépendantes. Les modèles dynamiques de données de panel permettent de prendre en compte les dépendances temporelles et spatiales, ainsi que les effets fixes et aléatoires. Ils sont largement utilisés dans les études économiques et sociales.
Cette liste n’est bien sûr pas exhaustive et il existe de nombreuses autres méthodes avancées en économétrie, telles que les modèles de sélection, les modèles de comptage, les modèles de données de survie, les modèles de régression quantile, etc.
L'économétrie au-delà du modèle linéaire classique
Au-delà du modèle linéaire classique, l’économétrie propose une gamme de méthodes avancées pour analyser les données économiques. Voici quelques-unes de ces méthodes dont certaines seront abordées lors de la formation :
Modèles à variables instrumentales : Ces modèles sont utilisés lorsque les variables explicatives peuvent être endogènes, c’est-à-dire qu’elles sont corrélées avec les erreurs de régression. Les variables instrumentales sont des variables exogènes qui sont corrélées avec les variables explicatives endogènes, mais qui ne sont pas directement corrélées avec les erreurs de régression. Les techniques d’estimation des variables instrumentales, telles que la méthode des moindres carrés en deux étapes (2SLS) et la méthode du maximum de vraisemblance généralisée (GMM), permettent de surmonter le biais résultant de l’endogénéité.
Modèles à effets fixes et effets aléatoires : Ces modèles sont utilisés pour prendre en compte l’hétérogénéité non observée entre les individus ou les unités d’observation. Les modèles à effets fixes permettent de capturer les différences individuelles constantes dans le temps, tandis que les modèles à effets aléatoires permettent à ces différences de varier au fil du temps. Ces modèles sont souvent utilisés dans les données de panel où les individus sont suivis sur plusieurs périodes.
Modèles de séries temporelles : Les modèles de séries temporelles sont utilisés pour analyser les données qui évoluent dans le temps. Ils incluent des modèles autorégressifs (AR), des moyennes mobiles (MA), des modèles ARMA (autorégressifs à moyenne mobile), des modèles ARIMA (autorégressifs intégrés à moyenne mobile) et des modèles ARCH/GARCH (autorégressifs conditionnels hétéroscédastiques généralisés). Ces modèles sont utilisés pour capturer la structure temporelle, les tendances et les motifs cycliques dans les données économiques.
Modèles de choix discret : Ces modèles sont utilisés pour analyser des situations où les variables dépendantes sont qualitatives ou discrètes, par exemple, lors de l’analyse des choix de consommation, de participation au marché du travail, de décisions d’investissement, etc. Les modèles de choix discret, tels que le modèle probit, le modèle logit, le modèle multinomial, etc., permettent de modéliser et d’estimer les probabilités de différentes alternatives.
Modèles de données de panel dynamiques : Ces modèles sont utilisés pour analyser des données de panel où les variables évoluent dans le temps et sont interdépendantes. Les modèles dynamiques de données de panel permettent de prendre en compte les dépendances temporelles et spatiales, ainsi que les effets fixes et aléatoires. Ils sont largement utilisés dans les études économiques et sociales.
Cette liste n’est bien sûr pas exhaustive et il existe de nombreuses autres méthodes avancées en économétrie, telles que les modèles de sélection, les modèles de comptage, les modèles de données de survie, les modèles de régression quantile, etc.