Devoir de Philosophie

Introduction à L'Econométrie

Publié le 02/04/2013

Extrait du document

ECONOMETRIE (*) Hélène Hamisultane I/ QU'EST CE QUE L'ECONOMETRIE ? II/ LE MODELE DE REGRESSION SIMPLE II.1/ Méthode d'estimation des Moindres Carrés Ordinaires (MCO) II.2/ Hypothèses et propriétés des estimateurs des MCO II.3/ Critère de jugement de la qualité de l'ajustement d'un modèle : R² III/ LE MODELE DE REGRESSION MULTIPLE III.1/ III.2/ III.3/ III.4/ Méthode d'estimation des Moindres Carrés Ordinaires (MCO) Hypothèses et propriétés des estimateurs des MCO Critère de jugement de la qualité de l'ajustement d'un modèle : R² , R2 , s c Utilisation de variables indicatrices pour la correction des valeurs anormales et détection des valeurs anormales. III.5/ Prévision IV/ LES TESTS IV.1/ IV.2/ IV.3/ IV.4/ IV.5/ IV.6/ IV.7/ Test de significativité d'un coefficient : test de student Test de significativité global : test de Fisher Test de normalité des erreurs Tests d'autocorrélation : Durbin-Watson et Box-Pierce Test d'hétéroscédasticité : test de White Test de stabilité : test de Chow Test de colinéarité : test de Belsley Khu Welsh V/ VIOLATION DES HYPOTHESES V.1/ Méthode des Moindres Carrés Généralisés (MCG) V.2/ Autocorrélation des erreurs d'ordre 1 et MCG : méthode de Cochrane-Orcutt V.3/ Hétéroscédasticité et MCG (*) Document inspiré de l'ouvrage de Bourbonnais (2000), Econométrie, Dunod. 1 VI/ LES MODELES DYNAMIQUES VI.1/ Modèle autorégressif : critères de Akaike, Schwarz et « h « de Durbin VI.2/ Modèle autorégressif à retards échelonnés BIBLIOGRAPHIE : o o Bourbonnais R. (2000), Econométrie, DUNOD. Johnston J. et Dinardo J. (1999), Méthodes Econométriques, Economica. ????? I/ QU'EST CE QUE L'ECONOMETRIE ? La démarche économétrique consiste à représenter à l'aide d'équations le comportement d'un phénomène observé et à estimer les coefficients des équations en recourant à l'historique du phénomène et ceci dans le but de le comprendre, de l'expliquer, de le reproduire et de le prévoir. Admettons que nous constatons le fait économique suivant : Figure 1 : Revenu disponible et Consommation des ménages au cours du temps 550 500 450 400 350 300 250 200 150 C RD 100 29 33 37 41 45 49 53 57 61 65 69 On observe que les 2 courbes évoluent pratiquement dans le même sens : elles augmentent et diminuent simultanément. On peut penser qu'il y a un lien entre ces 2 variables. On peut en effet penser que la consommation C des ménages est influencée par le revenu disponible RD. Lorsque le revenu augmente, la consommation s'accroît. 2 En mettant en abscisse le revenu disponible et en ordonnée la consommation des ménages, on obtient le graphique suivant : Figure 2 : Consommation des ménages en fonction du revenu disponible 500 450 400 350 c 300 250 200 150 100 80 160 240 320 400 480 560 rd On s'aperçoit que les points forment une droite. On peut supposer qu'elle a pour équation : Ct = a1RDt + a0 où Ct et RDt désignent respectivement la consommation et le revenu disponible à l'instant t. A partir de cette droite (ou dit modèle(1)), des données recueillies sur la consommation et le revenu disponible des ménages au fil du temps et de la théorie économétrique que nous présenterons ci-après, on peut déterminer la valeur des paramètres a1 et a0. La connaissance de ces valeurs nous permettra d'une part de mesurer l'influence de la variable explicative (RDt) sur la variable à expliquer (Ct) et d'autre part de prévoir l'évolution de la variable endogène. En connaissant l'évolution future de la consommation des ménages, une entreprise peut par exemple envisager d'augmenter ou non sa production. II/ LE MODELE DE REGRESSION SIMPLE Soit le modèle suivant : yt = a1xt + a0 . (1) Il s'agit ici d'un modèle en série temporelle dans lequel les variables évoluent au cours du temps. Il existe aussi les modèles en coupe instantanée dans lesquels les variables représentent des phénomènes observés au même instant. 3 On parle de modèle de régression simple car le modèle ne comporte qu'une seule variable explicative qui est xt. Lorsque le modèle comporte plusieurs variables explicatives, on parlera de modèle de régression multiple. On cherche à estimer les coefficients a1 et a0 de cette droite dans le but de reproduire le phénomène économique observé. On n'étudiera que l'estimation des modèles linéaires (les droites) à une ou plusieurs variables. Il existe des modèles non linéaires (à seuil(2) par exemple) dont l'étude ne sera pas abordés ici. Notations : Le modèle à estimer s'écrit : yt = a1xt + a0 + ?t avec par exemple t = 1980, 1981,..., 2004 (qui peut être remplacé par un nombre : t = 1,2,...,T ) où t est la date à laquelle on observe la valeur de yt et de xt et ?t est une variable aléatoire représentant l'erreur de spécification dont les caractéristiques seront précisées au cours de l'énoncé des hypothèses du modèle. On introduit la variable ?t pour marquer le fait que toute modélisation d'un phénomène ne peut pas être parfaite. Une fois que les coefficients sont estimés, le modèle va s'écrire : ou encore ?t = â1xt + â0 yt = â1xt + â0 + et où â1 et â0 désignent les valeurs estimées des paramètres a1 et a0, et = yt - ?t est appelé le résidu du modèle. et est l'estimateur de l'erreur ?t que l'on ne connaît pas. II.1/ Méthode d'estimation des Moindres Carrés Ordinaires (MCO) Comment estimer a1 et a0 pour reproduire au mieux le phénomène économique observé ? La technique des Moindres Carrés Ordinaire (MCO) apporte une réponse au problème posé. On doit estimer a1 et a0 de façon à minimiser la distance au carré entre chaque point observé yt et chaque point ?t donné par la droite ?t = â1xt + â0. (2) Se reporter à l'ouvrage de Lardic et Mignon (2002), Econométrie des Séries Temporelles Macroéconomiques et Financières, Economica. 4 Soit e = yt - ?t l'écart entre ces deux mesures, la méthode ou technique des MCO consiste à rechercher les valeurs de a0 et a1 de façon à minimiser la quantité suivante : T T t=1 t=1 T Min ? et2 = min ? (yt - ?t)² = min ? (yt - â1xt - â0)² = min S t=1 où T désigne le nombre d'observations pour les variables yt et xt. Les conditions nécessaires du 1er ordre pour obtenir un optimum pour S sont : o ?S =0 ?â0 <=> T ? -2(yt - â1xt - â0) = 0 -> dite "équation normale" t=1 T T T t=1 t=1 <=> ? yt - ? â1xt - ? â0 = 0 t=1 T T <=> ? â1xt ? yt t=1 t=1 - T T - Tâ0 =0 T ^ ^ <=> y - a1 x - a 0 = 0 ^ -> la droite d'ajustement y t passe par le point moyen (x,y) <=> ^ â0 = y - a1 x -> estimateur de a0 par les MCO o ?S =0 <=> ?â1 T ? -2xt(yt - â1xt - â0) = 0 -> "équation normale" t=1 T T T t=1 t=1 <=> - ? xtyt + ? â1x2 + ? â0xt = 0 t t=1 T T ? xtyt <=> - t=1 T + T de a0 t=1 T T + â0?xt t=1 T =0 T T ? xtyt <=> - t=1 â1? x2 t + â1? x2 t t=1 T ^ + ( y - a1 x ) x = 0 en utilisant l'expression de l'estimateur 5 T ? xtyt <=> - t=1 T ? T x2 ? ?? t ? 2 ^ -x ? + yx =0 + a1 ? t =1 ?T ? ? ? ? ? T T ? xtyt <=> â1 = ? xtyt t=1 t=1 - yx T ?T 2 ? ?? xt ? ? t=1 - x2 ? ?T ? <=> ? (xt - x )(yt â1 = T = T - Tyx ?T 2 2? ?? xt - T x ? ? t=1 ? T ? ? y) T ? xtyt - Tyx t=1 = T ? x2 - T x t 2 t=1 -> estimateur de a1 par les MCO t=1 T ? ( xt - x ) ² t=1 car on a T ? (xt - x )(yt t=1 y) = T ? (xtyt - xt y - x yt + yx) t=1 T T T T t=1 t=1 t=1 t=1 = ? xtyt - ? xt y - ? x yt + ? y x T T ? xt T ? yt = ? xtyt - T. t=1 . y - x . t=1 . T + T y x T T t=1 T = ? xtyt - T x y - x y T + T y x t=1 T = ? xtyt - x y T. t=1 Les conditions suffisantes du 2nd ordre pour obtenir un minimum pour S sont : La fonction S est convexe car on a ?²S >0 ; ?â2 1 ?²S ?â2 1 ?²S ?â0 ?â1 ?²S ?â1 ?â0 > 0. ?²S ?â2 0 6 L'optimum trouvé est donc un minimum. II.2/ Hypothèses et propriétés des estimateurs des MCO Les hypothèses liées à l'erreur ?t sont : H1 : xt est une variable certaine (non aléatoire) => Cov(xt,?t) = 0 ?t : la variable explicative et l'erreur sont indépendantes. H2 : E(?t) = 0 ?t : l'erreur est d'espérance nulle. H3 : Var(?t) = E(?t2) - (E(?t))² = E(?t2) = ?2 ?t car on a supposé E(?t) = 0 ? => la variance de l'erreur est constante (soit homoscédasticité de l'erreur). H4 : Cov(?t,?t') = E(?t. ?t') - E(?t).E(?t') = E(?t. ?t') = 0 car on a E(?t) = 0 ?t ? t' => les erreurs sont non corrélées. Ces hypothèses permettent aux estimateurs d'obtenir les bonnes propriétés suivantes : 1/ les estimateurs sont sans biais (3) : E(â1) = a1 et E(â0) = a0 ; 2/ les estimateurs sont convergents (4) : lim Var(â1) = 0 et T ->? lim Var(â0) = 0 . T ->? Théorème de Gauss-Markov : Les estimateurs des MCO ont la plus petite variance parmi les estimateurs linéaires sans biais. On dit que ce sont des estimateurs BLUE (Best Linear Unbiased Estimator). (3) (4) Voir la démonstration à l'aide du modèle de régression multiple qui est plus simple à mener. Var(â1) = 2 ?? T ? (xt - x )² t=1 ?1 + x ? ?T ? (x - x )²? ? ? 2 et Var(â0) = ?2 ? T t t=1 (pour la démonstration : se reporter à l'ouvrage de Dormont, Introduction à l'économétrie, Montchrestien). 7 II.3/ Critère de jugement de la qualité de l'ajustement d'un modèle Soit la décomposition suivante : T T T t=1 t=1 t=1 ^ ? (yt - y )² = ?(?t - y )² + ? et2 SCT = SCE + SCR où SCT = somme des carrés totale ou variabilité totale de yt , SCE = somme des carrés expliquée ou variabilité expliquée par ?t , SCR = somme des carrés des résidus ou variabilité des résidus. Il vient l'équation suivante appelée équation d'analyse de la variance : T T ^ ?(?t - y )² ? ( yt - y ) ² t=1 T = t=1 T T ? et2 + t=1 T soit Var(y) = Var(?) + Var(e). A partir de l'équation d'analyse de la variance, on va construire le critère du R² (ou coefficient de détermination) pour juger de la qualité d'un ajustement. Le R² est donné par le rapport suivant : T R² = SCE = SCT T ^ ?(?t - y )² t=1 T T ?(?t - y )² = t=1 T ? e2 t = 1- t=1 T ? ( yt - y ) ² ? ( yt - y ) ² ? ( yt - y ) ² t=1 t=1 . t=1 8 T ? et = 0 ^ On a y = y car on a lorsque le modèle comporte une constante (5). t=1 Plus SCE est proche de SCT, meilleur est l'ajustement du nuage de points par la droite des MCO. Le R² est compris entre 0 et 1 (0 <= R² <= 1) : plus il est proche de 1, meilleur est l'ajustement. III/ LE MODELE DE REGRESSION MULTIPLE Le modèle de régression multiple est une généralisation du modèle de régression simple. Il comporte plusieurs variables explicatives. Soit le modèle de régression multiple suivant qui comporte k variables explicatives : yt = a0 + a1x1t + a2x2t + ... + ak-1 x(k-1)t + ?t Pour t = 1,2,...,T , on a (5) T Démonstration de ? et = 0 : t=1 ^ On a et = yt - yt ^ ^ <=> et = y t - a1 x t - a 0 . En sommant les et , on obtient T ?e t =1 t = T ? (y t =1 T ?e ^ ^ Or on a a 0 = y - a1 x . Il vient alors : t =1 t t ^ ^ - a1 x t - a 0) = = T ?y<...

Liens utiles