这些是经济计量中经常要面对的概念,但却并不是那么容易把他们弄清楚。
异方差:首先对最简单的异方差进行解释,异方差就是误差项没有常数方差,什么叫误差项没有常数方差了,这里面就先要对OLS(Ordinary Least Squares)进行说明,利用OLS进行回归的时候,确实是利用了很多数据x,y,但是我们这里估计的是Y=aX+b。因为我们利用的是一些样本,比如X1,X2,X3……,对应的我们可以认为是Y1,Y2,Y3…..在CLRM模型下有一个假定是X是非随机的(当然这是一个更为严格的假定,实际上书本上给的是cov(ut,xt)=0),但显然Y是随机的,也就是说,给出一个X1,对应的Y1是一个随机变量,但是我们将X1(或者x1,本来X,Y代表样本,是随机变量,x,y代表样本值,是观测值,但应该X1是代表因为是固定值,并没有区别)带入回归式后,得到的Y1却是一个随机变量了,它自然有期望和方差,这个方差是针对Y1而言,不是原来数据而言的方差。那么不同的X对应的不同的Y,也就同时对应了一些列的方差,也就会出现异方差问题。
其实要区别的就是,回归样本只是得到了一些列数据,这些数据的方差和异方差毫无关系。
引起异方差的原因,张老师强调最多的一种,就是截面数据中,区域分布不均衡,比如省份GDP,上海和新疆,两个方差肯定相差很大,不可以认为var(ut)=σ^2<00了。另外一种原因是模型设定的偏误,主要是遗漏变量的影响。遗漏变量进入模型的残差项当中,当省略的变量和回归方程的变量有相关关系时,不仅会带来内生性的问题(cov(ut,xt)≠0),也会带来异方差的问题。因为你看有这样的传导关系y(被解释变量)-x2(模型解释变量)-x1(省略变量)--u(残差项),就是说不通的状态下,残差的方差已经不相同了,自然也就是有了异方差。
后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。
异方差的检测可以用图示法,white方法,Goldfeld-Quandt检验,Breusch-Pagan/Godfrey LM检验等等,处理方法也有对数化或者White调整,加权最小二乘等等。但从现代的观点来看,从模型设定的角度对异方差进行修正才是可行的方法。
自相关:CLRM假定里面有这么一条cov(ui,uj)=0,如果违背了这一条,就是存在自相关了。自相关就是误差项之间不是不相关的,又成为序列相关。这里到没有什么辨别概念的意思,但是有一点,我觉得自相关按理来说应该指的是Yi,和Yj之间的关系,因为采用滞后模型的时候也是用Y的滞后期消除自相关的,但是这里面确实定义在残差项上,Ui和Uj之间的关系,倒也不是不能理解。
引起自相关可能的原因:从上面可以看出自相关和滞后期有不少关系,引起自相关的原因也可以分为两大类,一种是可以用滞后期消除的,如1经济数据的固有的惯性(inertia)带来的相关,比如经济系统自身的惯性,经济活动的滞后效应。这主要出现在时间序列数据当中,经济变量在时间上的惯性往往是造成自相关的主要原因。滞后效应指的是某一经济变量对另一经济变量的影响不仅影响于当期,而是延续若干期,由此带来变量的自相关。2过度反应。
还有就是不能用滞后期处理的了,比如1存在自相关的相关变量的省略,就是说一个变量对y有着显著影响,而且这一变量本身存在自相关,那么反应到残差项里面,也就会让残差项出现自相关了。没有这一变量的信息,你自然也处理不了。2对数据的处理造成了数据的内在联系,从而引起自相关现象,季节因素等等。3错误设定,比如非线性当线性做。4
自相关对参数估计的影响仍然是影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质。一般而言,在存在自相关的情况下,如果仍然用满足古典假定的OLS去估计参数及其方差,会低估真实的,更会低估参数估计的方差,从而是t统计量被高估,致使原来不显著的解释变量变得显著,夸大的参数的显著水平。
自相关存在而又忽略将影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质,和异方差相似。
检测自相关是比较容易的,比如DW检验,Breusch-Godfrey 检验等等。
下一篇是写内生性与外生性,这个是最让我纠结的。