Author Archives: laofish

关于南京话和其他

好几天没写博客了,主要是这些天确实比较忙,也没有什么研究工作心得之类。但是我这个博客就是一个私人记录的地方,最主要的目标就是自己日后翻看,不会有想要偷偷删了某篇文章的冲动就好,毕竟,写在网上的,就是公开的东西,我希望自己还是慎重一点,今天看到人渣经济笔记的郭凯出书了,果断的买了一本,不是为了看,就是为了支持一下作者,正如我买的那本独唱团(或许现在可以叫绝唱团了)。 不过没有研究,但是不代表没有思考,自己的兴趣相当广泛,曾经在这个问题上想过不少次,就是关于语言上的一些现象。当然,自己绝对是百分百的门外汉,想的只是好玩,肤浅至极,毫无价值,娱乐自己而已。 比如米这个词,现在网络上经常可以看到,好看的一米这种说法,我以为,米这个字,绝对就是屄这个词的替代。我家农村,和村里面差不多大的平辈交流时,极少会用一米,都是用的一屄,有个词经常用,一屄屌糟。我也不知道是不是这么写,不过南京话的发音大抵就是如此了。 南京话里面和性有关的词实在很多,不是有这么个笑话, “为什么你们南京人说话用”屌”字开头,”屄”字结尾?” .. .. .. ”吊问题难的一屄!!!” 屌字在南京话里面,基本上就是个冠词,和英语里面的the差不多的用途,其实也算不上多大的脏话了,但是屄这个词,以前输入法是很不好打的,大家就用其他的词代替,比如B,逼,大概是现在女性上网的多了,发泄自己情绪的时候,动不动就是个屄,有点不大合适,就用了米,然后,其实很快,群里面讨论什么的,米字就通用了。随便哪个女的说好看的一米,也没人觉得这里面和性有什么关系。 这种情况同样出现在擦这个词,ca,大概流行的时间还不长,其实就是肏这个词的变音,cao,操,本来是这么用,大概是属于男性专用词汇,可是现在这个ca,那就是男女不限,爱怎么用就怎么用了,使用场合大大拓宽。 其实我想,南京话里面和性有关的词汇比较多,使用频率也比较高,这不应该是个别现象,性本来就是人类社会最重要的影响因素之一,在语言上面体现出来那也实属自然,不过我外地去的不多,不知道外面世界是怎么样,倒是美国电影看了不少,那里面什么fucking之类,大概就和我们的操,屌,一样普遍吧。

Posted in 思考评论 | Tagged , | Leave a comment

内生性

从最根本的定义来说,内生外生首先是取决于系统的,在一个系统内部决定的变量,自然就是内生变量,在系统决定的变量,就是外生变量。比如,给一个系统,比如地球,那么当前情况下地球上一切可以统计的变量都是内生变量,但是阳光就是外生变量。那么如果以太阳系为研究的系统,那么自然,阳光此时也是内生变量了。 这样说内生性外生性似乎很容易理解,但是涉及到经济问题似乎不是那么好办了,因为经济系统中,所有的变量很难说是完全独立的,比如货币发行量,似乎是央行决定,按理说是外生的吧,但是慢着,央行的货币不是随便发的,也是因为有经济体有需求才会向社会发行货币,这个就是货币外生和货币内生的讨论,研究的文章有很多。 还是先说外生性吧,Leamer定义,如果y对x的条件分布(这个就是给出x值,对应随机变量y)不随x的生成过程的修正而发生变化,那么x就是外生变量。外生性似乎还是可以分为两类,前定性(前定变量是指独立于方程中同期和未来误差项的变量),严格外生(严格外生变量是指独立于方程中所有同期、未来,和过去误差项的变量)。 依照这个定义,我什么也看不出来,倒是可以从CLRM假定cov(Ut,Xt)≠0情况考虑。既然cov(Ut,Xt)≠0可以叫成内生性,那么cov(Ut,Xt)=0大概可以叫外生变量了吧。chris的书前面把这个假定强化为X是非随机变量,当显然这一假定是靠不住的,X更多情况下是随机变量。这里涉及到前面曾经困惑的一个概率,随机解释变量,随机解释变量就是说解释变量是随机的,原因根据我的思考总结,大概是这两类,1.观测值存在误差2.根据Y=α+θX+μ,如果Y能影响X,由于Y是随机的,自然X也就带有随机性了。 随机解释变量容易带来内生性的问题,但却也不是必然,比如X是随机解释变量,但是X和u是独立的,也就是说cov(Ut,Xt)=0的时候,是不违背CLRM假设的。其实到这里,我们讨论的一切,什么内生性,自相关,异方差,这些为什么要讨论呢,就是因为我们经常用OLS模型进行估计,而CLRM的五个假定就是为了使得OLS的估计具有一致性,无偏性,有效性。这时候,你看,即使X是随机变量,如果cov(Ut,Xt)=0,那么是用OLS模型估计的值仍然是具有上面三条性质的,也就是说回归没有问题。什么时候会出问题,cov(Ut,Xt)≠0,这个时候的回归就不是一致的了,这个可以从无偏定义推出来,即,然后将cov(Ut,Xt)≠0代入入就可以发现E(β)≠β等等类似,这个不是今天论述的重点。 顺带第一下CLRM第五条假设,残差u服从正太分布,这个和估计值的一致无偏有效性没有关系,但是在进行有效性检测是,就要用到这个假设了,如果残差不符合正太分布,根本就没办法进行任何检测了。不过好在根据中心极限定理,样本够多的时候,可以渐进趋向正太分布,拿来做有效性检测也不会有太大问题。 回到内生性的话题,解释变量的内生性指的是模型中的解释变量与扰动项相关,这个问题可以的原因大体有以下几条: 1 模型设定偏差,遗漏了变量,这样,被遗漏的变量就被放进了残差项了,如果对被解释的变量和其他解释变量相关,自然,就会出现cov(Ut,Xt)≠0也就是内生性问题了。 2测量误差,测量误差也有两种,一种是对被解释变量Y的测量误差,这个其实不会引起内生性,另一种是对解释变量X的测量误差。说明一下,被解释变量Y的测量误差,设y的真实值y*,测量值y,测量误差e0=y-y*,假设理论的回归方程为y*=β0+β1x1+….将测量误差带入方程得y*=β0+β1x1+….ε+e0=y*=β0+β1x1+….ν其中ν=ε+e0表示实际回归方程的残差,显然由于y的测量误差和xi是相互独立的,那么实际回归方程的残差v也与各解释变量相互独立(无关),所以还是满足外生性的。至于解释变量x的测量误差,回归式y=β0+β1x1+….ε中,测量误差产生于xk, ek=xk-xk*,将测量误差带入回归式y=β0+β1x1+….ε+βke那么如果cov(x*k,ek)=0,那么cov(xk,ek)=cov(x*k+ek,ek)=σ^2,此时的测量误差便会引起内生性的问题了。 3双向交互影响(或者同时受其他变量的影响)这种情况引起的内生性问题在现实中最为常见。其基本的原理可以阐述为,被解释变量y和解释变量x之间存在一个交互影响的过程。x的数值大小会引起y取值的变换,但同时y的变换又会反过来对x构成影响。这样,在如下的回归方程中:如果残差项ε的冲击影响了y的取值,而这样的影响会通过y传导到x上,从而造成了x和残差项ε的相关。也就是引起了内生性问题。这里举几个简单、但经常遇到的例子说明。例1:金融发展与经济增长 例2:外商直接投资FDI与经济增长 例3:犯罪率与警备投入。而我们通常最难以确定的内生性问题就是这个问题,因为经济学领域,变量大多都是相互影响的,毕竟都是在这样一个社会系统里面。而我们之前那些讨论的内容,通常都不是我们遇到的主要问题,因为测量误差是既成事实,改进很困难,而遗漏变量,这个是模型设定的时候,如果你遗漏了,别人挑刺也很难找出你遗漏了什么。倒是最后的交互影响,因为几个解释变量放在那里,他想挑刺就说内生性,因为经济系统内部内生性很多,如果你不能很好的解释,检验,这一道关就不能让别人信服。 网上有人说,内生变量和外生变量很好区别:外生变量就像函数中的参量一样,不受模型内部变量的影响。而内生变量受模型中的变量影响,比如X+Y=a  (1)X-Y=1    (2)将上面两个方程联立,可以得到一个模型,其中变量X 和Y是可以通过解方程从“模型中”解出的,故是内生变量。但是变量a无法通过解方程来决定,只能由外在因素决定,所以是外生的,相当于一个参数。这种说法倒是简单明了,很容易理解,也符合我们的直觉,但是在简历模型的时候,很多时候没有办法就是说a他就是外生的,他不是另外一个变量Z。 处理内生性的问题通常用工具变量法,或者两阶段最小二乘,这个和对内生性概念的理解就没什么关系,就不提了。

Posted in 读书笔记 | Tagged | Leave a comment

异方差与自相关

这些是经济计量中经常要面对的概念,但却并不是那么容易把他们弄清楚。 异方差:首先对最简单的异方差进行解释,异方差就是误差项没有常数方差,什么叫误差项没有常数方差了,这里面就先要对OLS(Ordinary Least Squares)进行说明,利用OLS进行回归的时候,确实是利用了很多数据x,y,但是我们这里估计的是Y=aX+b。因为我们利用的是一些样本,比如X1,X2,X3……,对应的我们可以认为是Y1,Y2,Y3…..在CLRM模型下有一个假定是X是非随机的(当然这是一个更为严格的假定,实际上书本上给的是cov(ut,xt)=0),但显然Y是随机的,也就是说,给出一个X1,对应的Y1是一个随机变量,但是我们将X1(或者x1,本来X,Y代表样本,是随机变量,x,y代表样本值,是观测值,但应该X1是代表因为是固定值,并没有区别)带入回归式后,得到的Y1却是一个随机变量了,它自然有期望和方差,这个方差是针对Y1而言,不是原来数据而言的方差。那么不同的X对应的不同的Y,也就同时对应了一些列的方差,也就会出现异方差问题。 其实要区别的就是,回归样本只是得到了一些列数据,这些数据的方差和异方差毫无关系。 引起异方差的原因,张老师强调最多的一种,就是截面数据中,区域分布不均衡,比如省份GDP,上海和新疆,两个方差肯定相差很大,不可以认为var(ut)=σ^2<00了。另外一种原因是模型设定的偏误,主要是遗漏变量的影响。遗漏变量进入模型的残差项当中,当省略的变量和回归方程的变量有相关关系时,不仅会带来内生性的问题(cov(ut,xt)≠0),也会带来异方差的问题。因为你看有这样的传导关系y(被解释变量)-x2(模型解释变量)-x1(省略变量)--u(残差项),就是说不通的状态下,残差的方差已经不相同了,自然也就是有了异方差。 后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。 异方差的检测可以用图示法,white方法,Goldfeld-Quandt检验,Breusch-Pagan/Godfrey LM检验等等,处理方法也有对数化或者White调整,加权最小二乘等等。但从现代的观点来看,从模型设定的角度对异方差进行修正才是可行的方法。 自相关:CLRM假定里面有这么一条cov(ui,uj)=0,如果违背了这一条,就是存在自相关了。自相关就是误差项之间不是不相关的,又成为序列相关。这里到没有什么辨别概念的意思,但是有一点,我觉得自相关按理来说应该指的是Yi,和Yj之间的关系,因为采用滞后模型的时候也是用Y的滞后期消除自相关的,但是这里面确实定义在残差项上,Ui和Uj之间的关系,倒也不是不能理解。 引起自相关可能的原因:从上面可以看出自相关和滞后期有不少关系,引起自相关的原因也可以分为两大类,一种是可以用滞后期消除的,如1经济数据的固有的惯性(inertia)带来的相关,比如经济系统自身的惯性,经济活动的滞后效应。这主要出现在时间序列数据当中,经济变量在时间上的惯性往往是造成自相关的主要原因。滞后效应指的是某一经济变量对另一经济变量的影响不仅影响于当期,而是延续若干期,由此带来变量的自相关。2过度反应。 还有就是不能用滞后期处理的了,比如1存在自相关的相关变量的省略,就是说一个变量对y有着显著影响,而且这一变量本身存在自相关,那么反应到残差项里面,也就会让残差项出现自相关了。没有这一变量的信息,你自然也处理不了。2对数据的处理造成了数据的内在联系,从而引起自相关现象,季节因素等等。3错误设定,比如非线性当线性做。4 自相关对参数估计的影响仍然是影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质。一般而言,在存在自相关的情况下,如果仍然用满足古典假定的OLS去估计参数及其方差,会低估真实的,更会低估参数估计的方差,从而是t统计量被高估,致使原来不显著的解释变量变得显著,夸大的参数的显著水平。 自相关存在而又忽略将影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质,和异方差相似。 检测自相关是比较容易的,比如DW检验,Breusch-Godfrey 检验等等。 下一篇是写内生性与外生性,这个是最让我纠结的。

Posted in 读书笔记 | Tagged , | Leave a comment