搜档网
当前位置:搜档网 › (完整版)伍德里奇计量经济学(第4版)答案

(完整版)伍德里奇计量经济学(第4版)答案

计量经济学答案

第二章

2.4 (1)在实验的准备过程中,我们要随机安排小时数,这样小时数(hours )可以独立于其它影响SAT 成绩的因素。然后,我们收集实验中每个学生SAT 成绩的相关信息,产生一个数据集{}n i hours sat i i ,...2,1:),(=,n 是实验中学生的数量。从式(2.7)中,我们应尽量获得较多可行的i hours 变量。

(2)因素:与生俱来的能力(天赋)、家庭收入、考试当天的健康状况

①如果我们认为天赋高的学生不需要准备SAT 考试,那天赋(ability )与小时数(hours )之间是负相关。②家庭收入与小时数之间可能是正相关,因为收入水平高的家庭更容易支付起备考课程的费用。③排除慢性健康问题,考试当天的健康问题与SAT 备考课程上的小时数(hours )大致不相关。

(3)如果备考课程有效,1β应该是正的:其他因素不变情况下,增加备考课程时间会提高SAT 成绩。

(4)0β在这个例子中有一个很有用的解释:因为E (u )=0,0β是那些在备考课程上花费小时数为0的学生的SAT 平均成绩。

2.7(1)是的。如果住房离垃圾焚化炉很近会压低房屋的价格,如果住房离垃圾焚化炉距离远则房屋的价格会高。

(2)如果城市选择将垃圾焚化炉放置在距离昂贵的街区较远的地方,那么log(dist)与房屋价格就是正相关的。也就是说方程中u 包含的因素(例如焚化炉的地理位置等)和距离(dist)相关,则E (u ︱log(dist))≠0。这就违背SLR4(零条件均值假设),而且最小二乘法估计可能有偏。

(3)房屋面积,浴室的数量,地段大小,屋龄,社区的质量(包括学校的质量)等因素,正如第(2)问所提到的,这些因素都与距离焚化炉的远近(dist,log(dist))相关

2.11(1)当cigs (孕妇每天抽烟根数)=0时,预计婴儿出生体重=110.77盎司;当cigs (孕

妇每天抽烟根数)=20时,预计婴儿出生体重(·bwght )=109.49盎司。

(110.77-109.49)/110.77=8.6%,抽烟数从0到20,预计儿童出生体重下降了约8.6%。

(2)并不能。还有其他因素可以影响婴儿出生体重,尤其是母亲的整体健康状况和产前保健的质量。这些因素还都可能与母亲怀孕期间的抽烟习惯有关。其它因素,比如咖啡因的摄入量也会影响婴儿出生体重,而且可能与母亲怀孕期间的抽烟习惯有关。

(3)如果预测出生体重为125盎司,则cigs=(125 – 119.77)/( –0.524) ≈–10.18 ,约为-10支,这是不可能的。当然,这只是告诉我们,对于预测婴儿出生体重这样复杂的因变量,如果只有一个解释变量,将会发生什么。预计婴儿出生体重的最大值是119.77盎司,然而样本中确有超过700个新生婴儿的体重超过了119.77盎司,这就说明模型建立不恰当

(4)85%的妇女怀孕期间不抽烟,即1388个样本中有大约1180个妇女不抽烟。因为我们只用cigs 一个变量解释婴儿出生体重,所以当cigs=0时,我们只有一个相对应的出生体重数。在cigs=0时,预计的出生体重数大致位于观测的出生体重数的中间。因此,我们可能会低估较高的出生体重数。

第三章

3.3(1)法学院的排名(rank 值)越大,说明学校威望越低:这会降低起薪。例如:rank=100说明有99所学校排在其前面。

(2)2β>0,3β>0;LSAT 和GPA 都是测量进入法学院的学生的整体素质,不论优秀的学生在哪里进入法学院,我们预期他们会赚得更多。平均来讲,3β和4β>0,法学院图书馆的藏书量及法学院每年的费用都能衡量学校的好坏(相对于藏书量,法学院每年的费用对起薪的正的效应并不那么明显,但它应反映教职工、基础设备等相关资源质量的好坏)。

(3)在其他条件不变的情况下,预计GPA 中位数相差一分会导致薪水有24.8%的差别。(恰好等于GPA 的相关系数)

(4)Log(libvol)的系数表明:法学院藏书量每增加1%,则学生起薪会提高0.095%。

(5)很明显,进入排名较靠前(数字较小)的法学院更好。如果法学院A 的排名比B 靠前20位,则A 法学院的起薪要高大约6.6%(0.0033*20*100%)

3.4(1)如果成年人为工作而放弃睡眠,工作多意味着睡眠会减少。所以1β>0.

(2)一般说来,2β和3β的的符号并不确定。虽然有人认为受过较高教育的人想要得到更完美的生活,所以他们的睡觉时间很少(2β<0)。睡眠时间与年龄之间的关系要比模型中给的复杂多,经济学家也并未对此作出更好的解释。

(3)因为工作时间以分钟为单位,我们把5小时化为分钟,则总工作时间为300分钟。睡眠时间预计会减少0.148*300=44.4分钟。从一周来看,少睡45分钟并不算是很大的舍弃。

(4)较多的教育意味着较少的睡眠时间,但教育对睡眠时间的影响是较小的。如果我们假设大学与高中的差别是4年,那么大学毕业生平均每年要少睡大约45(11.13*4)分钟。

(5)很明显,这3个解释变量只解释了睡眠时间11.3%的变异(2

R =0.113)。其他可能影响花在睡眠上时间的因素包括:健康状况、婚姻状况以及是否有孩子。一般来讲,这3个变量都与工作时间有关。(比如:身体状况较差的人工作时间较少)

第四章

4.3(1)尽管hrsemp (平均每个雇员每年接受培训的小时数)的标准误差没有改变,但系数增加了大约一半(-0.029到-0.042),t 统计量从-1.26到-2.21(-0.042/0.019),显著性水平为5%的临界值小于零。(当自由度为40时,显著性水平为5%的临界值约为-1.684;显著性水平为1%的临界值为-2.423,;p 值在0.01---0.05之间)。

(2)log(scrap )=0β+1βhrsemp+2βlog(sales)+3βlog(employ )+ u

=0β + 1βhrsemp + [2βlog(sales) – 2βlog(employ )]

+ [2βlog(employ ) + 3βlog(employ )] + u

=0β + 1βhrsemp + 2βlog(sales /employ )

+ (2β + 3β)log(employ ) + u , 我们令2β+3β=3θ,则原

式可写成:log(scrap )=0β+1βhrsemp+2βlog(sales/employ)+3θlog(employ )+ u

假设0H :3θ=0,意味着23ββ-=,当其他条件不变时,销售额增加1%与企业雇员人数减少1%对废品率的影响是相同的。

(3)不是。我们对log(employ)的系数感兴趣,其t 统计量为0.2(很小),因此我们可以得到:一旦我们控制了工人培训和销售—雇员比之后(以对数形式表示),以员工数量为测量标准的企业规模与废品率在统计上的显著性并不重要。

(4)零假设检验:0H :2β= –1. T 统计量=[–0.951– (–1)]/0.37= (1– 0.951)/0.37≈0 .132; 这个数字很小,我们不能拒绝单侧或双侧假设。即sales/employ 提高1%将伴随以废品率下降1%。

4.8(1)式中自由度df=706-4=702,自由度为702的双侧检验的5%的临界值是1.96。这样, t educ = -11.13/

5.88≈ -1.89, 所以|t educ |= 1.89< 1.96,在显著性水平为5%的时候,我们不能拒绝假设H 0: educ β = 0。同理:t age=2.20/1.45≈1.52<1.96。因此,对于双侧对立假设,educ 与age 在5%的水平上都不是个别显著的。

(2)ur

ur r ur df R q R R F /)1(/)(222--==702/)113.01(2/)103.0113.0(--≈3.96:;查表可知),(ur df q F =F (2,702)=3.00。3.96>3.00,所以在5%的显著性水平上,educ 与age 在原式中是联合显著的。

(3)几乎不影响。虽然educ 与age 在原式中是联合显著的,但在考虑它们之后,原式totwrk (总工作时间)的系数从-0.151变到了-0.148,这个影响是很小的。

(4)因为T 检验与F 检验是建立在同方差假定与其他线性模型假定基础上的,所以如果睡眠方程中含有异方差性,就意味着我们对方程的检验是无效的。

4.11(1)假定profmarg 不变,当sales 变化10%时,?rdinters=

(0.321/100)*10=0.0321,j 即rdintens 变化大约3%。相对于sales 的变化,rdintens 的变化是个较小的影响。

(2)H 0::1β=0 1H :1β>0 其中1β是log(sales)的系数。进行T 检验:t=216

.032.0≈1.486;自由度为df=32-3=29的单侧检验显著性水平为5%的临界值为1.699,因而在5%的显著性水平上我们不能拒绝原假设。自由度为df=32-3=29的单侧检验显著性水平为10%的临界值为

1.311,因而在10%的显著性水平上我们拒绝原假设而接受1β>0。

(3)Profmarg 的系数表示:profmarg 变化1%,rdintens 变化0.05%,这在经济上影响并不显著。

(4)对profmarg 的显著性进行T 检验:t=046

.005.0 1.087<1.311,因为它在统计上并不显著。 第五章

5.3风险承受能力越强,越愿意投资于股票市场,因此假设funds 和 risktol 正相关,我们使用等式因此

具有高度不一致(渐进有偏),这表明如果

我们在回归方程中省略risktol,并且它和funds高度相关,funds 的估计效应取决于risktol的效应。(省略risktol,回归方程倾向于高估funds的影响)

第六章

6.3(1)当其他要素固定时,我们有

等式两边同除以得到结果,

是不显著的,尽管

大于0,如果来我们考虑一个孩子多得一年

教育,孩子的父母会有更高的学历。

(2)我们选择pareduc 的两个具体值来解释交叉项系数,比如父母双方都受过大学教育时pareduc=32或父母都是高中毕业时pareduc=24,educ 的估计回报差额是0.00078(32-24)=0.0062,或者说0.62%。

(3)如果在方程中加入paredc 作为一个独立变量引入,交叉项系数是负的。Educ*pareduc 的t 统计量大约是-1.33.在10%的显著性水平上,在双侧对立假设上,t 统计量是不显著的。注意到,pareduc 的系数在5%的显著性水平上,在双侧对立假设下是显著的。这表明省略一个效应水平会如何导致交互效应的有偏估计。

6.5 (1)当转折点是 1?β/(2|2

?β|), or .0003/(.000000014) ≈ 21,428.57时开始为负的(以百万美元为计量单位)(对方程式求导,然后等式让等于0,即得到21,428.57)

(2)会,它的t 统计量大约为-1.89,这个在5%显著性水平上违背了单侧对立假设H 0: 1β < 0(co ≈ –1.70 with df = 29),即它是统计显著的,实际上,P 值是0.036。

(3)因为销售获取除以 1 000,得到 salesbil ,相应的系数乘以 1000 : (1,000)(0.00030) =0.30。标准错误乘以相同的因子。提示,salesbil2 = 销售额/1,000,000,所以对二次系数获取乘以 100 万: (1,000,000)(.0000000070) =.0070 ;它的标准误差也获取乘以 100 万。截距 或R 2(因为 rdintens 不其重新缩放)不会发生变化:

·rdintens

= 2.613+ 0.30 salesbil – 0.0070 salesbil 2 (0.429) (0.14) (0.0037)

n = 32, R 2 = 0.1484.

(4)第三小题的方程更容易阅读,因为它右侧包含更少的0,两个方程的解释是相同的,只是记账尺度不同。

第7章

7.1(1)男性系数是87.75,所有估计一男子差不多一周比女人多睡一个半小时,此外,t male =87.75/34.33≈ 2.56,这个数接近对于双侧对立假设的1%水平的临界值(2.58),因此, 性别差异的证据是相当强烈的。

(2)totwrk 的 t 统计是 ?0.163/0.018 ≈ ?9.06,这是统计性水平是很显著的。这个系数意味着多工作一个小时(60 分钟)就会少睡0.163(60) ≈ 9.8分钟。

(3)为了获得2r R 的值, R -squared 来自约束回归方程,我们需要估计没有age 和age^2的模型,当age 和 age2 都在模型中时,只有这两个参数均为零时才有没有影响。

7.2 (i) 如果 ?cigs = 10 那么 ·log(

)bwght ? = -0.0044(10) = -0.044, 意味着每天多抽十根烟,婴儿出生体重下降 4.4% 。

(2)在第一个方程中,保持其他因素不变,预计一个白人孩子比一个非白人孩子的出生体重高5.5%。而且t white ≈ 4.23,这个比普通的临界值高,因此,白人孩子和非白人孩子的差异也是统计显著性的。

(3)如果孩子的母亲的教育水平多一年,孩子出生体重预计会高0.3%,这不是一个太大的影响,t 统计量等于-1,因此其统计显著性不明显。

(4)这两个回归方程使用的是不同的观测值,第二个回归方程用的是较小的观测值因为在某些观测值中母亲或父亲的值消失了,我们需要使用估计的观测值来重新估计第一个方程(获得R -squared 的值)。

7.3(1)hsize2的t统计量的绝对值大于4,有很强的证据表明是统计显著的,我们是通过找到转折点来获得的。在其他条件不变的情况下hsize扩大了?sat的值:19.3/(2?2.19) ≈ 4.41.因为hsize是以百人计学生规模,毕业生的最优规模大约是441.

(2)这个是由female的系数给出的(当black = 0时):非黑人女性比非黑人男性的SAT分数低45分,t统计量大约是-10.51.因此这个估计差异的统计显著性非常大。

(3)由于female = 0,black的系数表明一个黑人男性的SAT分数比同类非黑人男性低170分。T统计量的绝对值高0.13,因此,我们很容易就可以拒绝分数没有差异的虚拟假设。(t=-13.36,故拒绝原假设,即他们的分数存在差异)

(4)我们为black females 插入black = 1, female = 1值,为nonblack females插入black = 0 and female = 1值,因此差异为–169.81 + 62.31 = -107.50.因为这个估计结果取决于两个系数,我们不能从给定的信息中构造出t统计量,最简便的方法是为三或四个种族或性别类定义虚拟变量,选择nonblack females 作为基础变量,因此,当black female的系数也是虚拟变量时我们就能获得所要的T统计量

第八章

4(1)这些系数有预期的估计效应。如果一个学生选修的课程平均成绩很高-通过较高的crsgpa反映出来-则他的成绩就会很高。学生在过去表现越是良好-通过cumgpa衡量-则学生在此学期平均成绩就会越好。最后,tothrs是对经验的衡量,这个系数表示报酬递增。对于crsgpa,t统计量很大,使用普通标准误其值大于5(这是这两个中最大的).对cumgpa 使用稳健的标准误,它的t统计量大约是2.61,在5%的显著性水平上是统计显著的。对于tothrs,使用任意标准误其t统计量仅约为1.17,因此在5%的水平上不是统计显著的。

β= 1 意(2)很容易发现在模型中没有解释变量。如果crsgpa是仅有的解释变量,H0:

crsgpa

味着在没有任何信息的情况下,对学生长期GDP最好的预测是学生课程的平均GDP,它可以

β= 1不一定正确,通过定义获得(截距在这种情况下将是0).加入更多的解释变量,

crsgpa

因为crsgpa与学生的品质相关(例如,学生选修的课程可能是受考试成绩衡量的能力和过去的在校表现影响的)。但是,对检验这一假说很有意思。

使用普通标准误得到的t统计量是t= (0.900 – 1)/0.175 ≈-0.57;使用异方差稳健标准误得出t≈-0.60。在这两种情况下,在任何合理的显著性水平上我们都不能拒绝H0:

β= 1,当然也包括5%。

crsgpa

(3)在旺季效应的系数上赛季,这意味着,当运动员的运动存在竞争时,他的GDP最低大约是0.16点。使用普通标准误其t统计量大约是-1.6,然而使用稳健标准误其t统计量大约是-1.96.

对于双侧对立假设,使用稳健标准误得出的t统计量在5%水平上是显著的(标准正常临界值是1.96),而使用普通标准误其t统计量在10%水平上不是显著的(临界值是1.65)。因此,在这种情况下使用不同的标准误有不同的结果。这个例子有点不寻常,因为稳健标准误往往是这两个中较大的那个。

6(1)所提出的检验是对帕甘检验和怀特检验的结合。有k+1个回归量,原始解释变量和拟合值的平方。因此,检验的限制数是K+1,这是分子的自由度,分母的自由度是n -(k+ 2) = n -k-2

(2)对于帕甘检验,这很容易:混合检验有一个额外的回归量2?y, 因此对于混合检验而言,R-平方不会小于帕甘检验下的R-平方。对于怀特检验特殊形式,这个参数更加微妙。

在回归中(8.20), 拟合值是回归量的线性函数(当然,在线性函数中这个系数是OLS 的估计值)。因此,我们正对原始解释变量如何在回归中出现作出限制。这意味着,怀特检验特殊形式下的R-平方不会大于混合检验下的R-平方。

(3)不是,对这些回归量进行联合显著性检验其F 统计量取决于2222垐/(1)u u

R R ,它是真实的且这个比率随着2

2

?u R 增加而增加。但F 统计量也取决于自由度,且这个自由度在这三个检验中都是不同的:帕甘检验是怀特检验和混合检验的特例。所以,我们不知道哪个检验会产生最小的p 值。

(4)如在(2)中所讨论的那样,OLS 拟合值是原来回归量的线性组合。因为这些回归量出现在混合检验中,增加OLS 拟合值是多余的,会导致完全共线性。

第九章

1.如果β6≠0或β7≠0,在添加人口参数分别是ceoten2 and comten2后,存在函数形式误设。因此,我们使用R2形式的F 检验对这些变量进行联合显著性检验:F = [(.375 ? .353)/(1 ? .375)][(177 –8)/2] ≈

2.97。(2 ∞)时,10%的临界值是2.30,而5%的临界值是

3.00。因此,p-值是略高于0.05,这是函数形式误设的合理证据。(当然,对于不同程度解释变量的估计偏效应是否有实际影响是另一回事)

3.(1)联邦政府资助的学校午餐计划的申请资格是与经济上处于不利地位紧密相连的。因此,享受午餐计划的学生比例与处于贫困中的学生比例非常相近。

(2)从回归方程中忽略重要变量时,我们可以使用常用的推理。log(expend)变量和lnchprg 是呈负相关的:平均而言,有贫困儿童的校区花的更少。另外,β3<0。从表3.2可知,从回归模型中忽略lnchprg (贫困的代理)会产生一个向上的偏估计β1 [在模型中忽略了log(enroll)的存在]。因此,当我们控制贫困比率时,支出的影响会下降。

(3)一旦,我们控制了lnchprg ,log(enroll)的系数会变为负的且其t 统计量大约为-2.17.在5%的水平上双侧对立是显著的。这个系数意味着

因此,入学人数增加

10%会导致math10下降0.126个百分点。

(4)math10 和 lnchprg 是百分数,因此,lnchprg 增加10个百分点会导致math10下降约3.23个百分点,这是一个相当大的影响。

(5)列(1)中所有的变量只解释了对math10影响的很小部分:不足3%。列(2),我们解释了近19%(这样仍有许多变量没有解释)。显然,math10的大部分变量是通过lnchprg 的变量得到解释。在学校行为研究中这是个很普通的发现:家庭收入(或相关因素,如生活在贫困中)在解释学生行为方面比花在每个学生身上的支出或学校其他特点方面更重要。

第十章

1.不同意。大部分的时间序列过程随时间推移是相关的,且很多都有很强的相关性。这意味着他们不是独立的横截面观测,而是代表了不同的时间段。即使是大致不相关的序列- 如股票收益率 - 似乎并不是独立分布,如你将在第12章中看到的动态形式下的异方差性。

2.同意。这句话可以从定理10.1中得到。特别是,我们不需要同方差和无序列相关的假设。

3.不同意。趋势变量在回归模型中常常被用作因变量。我们在解释结果时必须要谨慎,因为我们可能在Yt 和趋势解释变量中只是找到一个虚假的关系。在回归中包含有趋势的因变量或自变量是合理的。正如第10.5节中讨论的那样,因变量有趋势时,通常r^2可能会产生误导。

4.同意。使用年度数据时,每一个时间段代表一年,与任何季节性变化都没有联系。

第十一章

证明:由于协方差平稳,= Var()不依赖于t,因此sd()=,对于任何的h>=0.根据定义,

第十二章

12.1从方程12.4中可以找出原因:通常OLS标准误差是对的估计量。当因变

量和自变量是水平in level(或对数)形式时,AR(1)的参数,ρ,在时间序列回归模型中往往是正的。此外,回归模型中不同时期的自变量往往是正相关的,因此,

-

当{}的样本均值不是0时,它通常出现在(12.4)方程中—对于多数时期t和t+j来说,往往是正的。有多个解释变量的公式更为复杂,但也有类似的特征。

如果ρ < 0或{}是负自相关的,(12.4)方程中最后一行的第二项可能是负的,在这种情况下,真正的标准偏差实际上会小于

这是个分析1981到2001年国内生产总值(GDP)与消费水平(XF)之间的相关关系的例子。因变量:GDP

方法:最小二乘法

时间:11年6月3日13点19分

样本:1981年——2001年的数据

由表格可以建立GDP跟XF的方程:

GDP=-134.93+1.66XF

Variable 变量Coefficient 系数Std.Error标准差t-Statistic t统计量Prob. 概率

其中:t-Statistic= Coefficient 系数/ Std.Error标准差

R-squared ——是剩余平方和与总平方和的比值,即R^2=SSE/SST 详见课本76页Ajusted R-squared ——调整的R^2 一般Ajusted R-squared比R-squared要小, 调整后的可决系数剔除了解释变量个数对解释能力的影响。

S.E.of regression ——回归标准误

Sum squared resid——残差平方和

Durbin-Watson stat——DW统计量,检验模型是否含有一阶自相关,其值越接近2越好Mean dependent var——因变量均值

S.D.dependent var——因变量标准差

F-Statistic——F统计量

Prob(F-Statistic)——F统计量的概率

计量经济学课后习题

计量经济学课后习题 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 4.如何缩小置信区间?(P46) 由上式可以看出(1).增大样本容量。样本容量变大,可使样本参数估计量的标准差减小;同时,在同样置信水平下,n越大,t分布表中的临界值越小。(2)提高模型的拟合优度。因为样本参数估计量的标准差和残差平方和呈正比,模型的拟合优度越高,残差平方和应越小。 1.为什么计量经济学模型的理论方程中必须包含随机干扰项? (经典模型中产生随机误差的原因) 答:计量经济学模型考察的是具有因果关系的随机变量间的具体联系方式。由于是随机变量,意味着影响被解释变量的因素是复杂的,除了解释变量的影响外,还有其他无法在模型中独立列出的各种因素的影响。这样,理论模型中就必须使用一个称为随机干扰项的变量宋代表所有这些无法在模型中独立表示出来的影响因素,以保证模型在理论上的科学性。 3.一元线性回归模型的基本假设主要有哪些? 违背基本假设的模型是否不可以估计? 答:线性回归模型的基本假设有两大类:一类是关于随机干扰项的,包括零均值,同方差,不序列相关,满足正态分布等假设;另一类是关于解释变量的,主要有:解释变量是非随机的,若是

期末试题4及答案-计量经济学复习课程

计量经济学 一、判断题(每小题2分,共10分) 1. 间接最小二乘法适用于过度识别方程。( ) 2. 假设模型存在一阶自相关,其他条件都满足,则仍用OLS 法估计参数,得到的估计量仍是无偏的,不再是有效的,显著性检验失效,预测失效。() 3. 用一阶差分法消除自相关时,我们假定自相关系数等于-1。( ) 4. 当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性。() 5. 在模型 012t t t t Y B B X B D u =+++中,令虚拟变量D 取值为(0,2)而不是(0,1) ,那 么参数2B 的估计值也将减半,t 值也将减半。( ) 二、选择题(每小题2分,共20分) 1、单一方程计量经济模型必然包括( )。 A .行为方程 B .技术方程 C .制度方程 D .定义方程 2、在同一时间不同统计单位的相同统计指标组成的数据组合,是( )。 A .原始数据 B .时点数据 C .时间序列数据 D .截面数据 3、计量经济模型的被解释变量一定是( )。 A .控制变量 B .政策变量 C .内生变量 D .外生变量 4、同一统计指标按时间顺序记录的数据称为( )。 A .横截面数据 B .时间序列数据 C .修匀数据 D .原始数据 5、模型中其数值由模型本身决定的变量变是( )。 A .外生变量 B .内生变量 C .前定变量 D .滞后变量 6、半对数模型μ ββ++=X Y ln 10中,参数1β的含义是( )。 A .X 的绝对量变化,引起Y 的绝对量变化 B .Y 关于X 的边际变化 C .X 的相对变化,引起Y 的期望值绝对量变化 D .Y 关于X 的弹性 7、在一元线性回归模型中,样本回归方程可表示为:( ) A .t t t u X Y ++=10ββ B . i t t X Y E Y μ+=)/( C . t t X Y 10???ββ+= D .()t t t X X Y E 10/ββ+= (其中n t ,,2,1Λ=) 8、设OLS 法得到的样本回归直线为i i i e X Y ++=21??ββ,以下说法不正确的是 ( )。

计量经济学(第四版)习题及参考答案解析详细版

计量经济学(第四版)习题参考答案 潘省初

第一章 绪论 1.1 试列出计量经济分析的主要步骤。 一般说来,计量经济分析按照以下步骤进行: (1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项? 为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。 1.3什么是时间序列和横截面数据? 试举例说明二者的区别。 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。 横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4估计量和估计值有何区别? 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y 就是一个估计量,1 n i i Y Y n == ∑。现有一样本,共4个数,100,104,96,130,则 根据这个样本的数据运用均值估计量得出的均值估计值为 5.1074 130 96104100=+++。 第二章 计量经济分析的统计学基础 2.1 略,参考教材。

2.2请用例2.2中的数据求北京男生平均身高的99%置信区间 N S S x = = 4 5 =1.25 用 =0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684 也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH 备择假设 120:1≠μH 检验统计量 () 10/2510/25 X X μσ-Z == == 查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH 备择假设 : 2500:1≠μH ()100/1200.83?480/16 X X t μσ-= === 查表得 131.2)116(025.0=-t 因为t = 0.83 < 131.2=c t , 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。

计量经济学 案例分析

第二章 案例分析 研究目的:分析各地区城镇居民计算机拥有量与城镇居民收入水平的关系,对更多规律的研究具有指导意义. 一. 模型设定 2011年年底城镇居民家庭平均每百户计算机拥有量Y 与城镇居民平均每人全年家庭总收入X 的关系 图2.1 各地区城镇居民每百户计算机拥有量与人均总收入的散点图 由图可知,各地区城镇居民每百户计算机拥有量随着人均总收入水平的提高而增加,近似于线性关系,为分析其数量性变动规律,可建立如下简单线性回归模型: Y t =β1+β2X t +u t 50 60 708090100 110120130140 X Y

二.估计参数 假定所建模型及其随机扰动项u i满足各项古典假设,用普通最小二乘法(OLSE)估计模型参数.其结果如下: 表2.1 回归结果 Dependent Variable: Y Method: Least Squares Date: 11/13/17 Time: 12:50 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 11.95802 5.622841 2.126686 0.0421 X 0.002873 0.000240 11.98264 0.0000 R-squared 0.831966 Mean dependent var 77.08161 Adjusted R-squared 0.826171 S.D. dependent var 19.25503 S.E. of regression 8.027957 Akaike info criterion 7.066078 Sum squared resid 1868.995 Schwarz criterion 7.158593 Log likelihood -107.5242 Hannan-Quinn criter. 7.096236 F-statistic 143.5836 Durbin-Watson stat 1.656123 Prob(F-statistic) 0.000000 由表2.1可得, β1=11.9580,β2=0.0029 故简单线性回归模型可写为: ^ Y X t t=11.9580+0.0029 其中:SE(β1)=5.6228, SE(β2)=0.0002 R-squared=0.8320,F=143.5836,n=31

计量经济学(伍德里奇第五版中文版)答案

第1章 解决问题的办法 1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。 (二)呈负相关关系意味着,较大的一类大小是与较低的性能。因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。 (三)鉴于潜在的混杂因素- 其中一些是第(ii)上市- 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。 1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同? (二)公司很可能取决于工人的特点选择在职培训。一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。企业甚至可能歧视根据年龄,性别或种族。也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。 (iii)该金额的资金和技术工人也将影响输出。所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。管理者的素质也有效果。 (iv)无,除非训练量是随机分配。许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。 1.3没有任何意义,提出这个问题的因果关系。经济学家会认为学生选择的混合学习和工作(和其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有168小时。然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第2章开始。但我们不会声称一个变量“使”等。他们都选择学生的变量。 第2章 解决问题的办法

计量经济学案例分析汇总

计量经济学案例分析1 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为元, 最低的黑龙江省仅为人均元,最高的上海市达人均10464元,上海是黑龙江的倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表的数据: 表 2002年中国各地区城市居民人均年消费支出和可支配收入

计量经济学-案例分析-第六章

第六章 案例分析 一、研究目的 2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农村居民消费模型也能用于农村居民消费水平的预测。 二、模型设定 正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为 t t t u X Y ++=21ββ (6.43) 式中,Y t 为农村居民人均消费支出,X t 为农村人均居民纯收入,u t 为随机误差项。表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。 表6.3 1985-2003年农村居民人均收入和消费 单位: 元

2000 2001 2002 2003 2253.40 2366.40 2475.60 2622.24 1670.00 1741.00 1834.00 1943.30 314.0 316.5 315.2 320.2 717.64 747.68 785.41 818.86 531.85 550.08 581.85 606.81 为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。 根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得 t t X Y 0.59987528.106?+= (6.44) Se = (12.2238) (0.0214) t = (8.7332) (28.3067) R 2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706 该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW 统计表可知,d L =1.18,d U = 1.40,模型中DW

第四章计量经济学答案范文

第四章一元线性回归 第一部分学习目的和要求 本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。回归方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。本章还介绍了如何应用线性模型来建立预测和控制。需要掌握和理解以下问题: 1 一元线性回归模型 2 最小二乘方法 3 一元线性回归的假设条件 4 方差分析方法 5 t检验方法 6 相关系数检验方法 7 参数的区间估计 8 应用线性回归方程控制与预测 9 线性回归方程的经济解释 第二部分练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 ξ,目的在于使模型更1 在经济计量模型中引入反映()因素影响的随机扰动项 t 符合()活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的()、社会环境与自然环境的()决定了经济变量本身的();(2)建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ()是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。()是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的()。某自变量回归系数β的意义,指

计量经济学-案例分析-第八章

第八章案例分析 改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存 款也迅速增长。经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。为了考察改革开放以来中 国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表 居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。 表8.1为1978-2003年中国的国民总收入和城乡居民人民币储蓄存款年底余额及增加额的数据。 单位:亿元 2004 鉴数值,与用年底余额计算的数值有差异。 为了研究1978—2003年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城

乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示: 图8.5 从图8.5中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量 (YY ),并作时序图(见图 8.6) 从居民储蓄增量图可以看出,城乡居民的储蓄行为表现出了明显的阶段特征: 2000年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图 看(见图8.7),也呈现出了相同的阶段性特征。 为了分析居民储蓄行为在 1996年前后和2000年前后三个阶段的数量关系,引入虚拟变 量D 和D2°D 和D 2的选择,是以1996>2000年两个转折点作为依据,1996年的GNI 为66850.50 亿元,2000年的GNI 为国为民8254.00亿元,并设定了如下以加法和乘法两种方式同时引入 虚拟变量的的模型: YY = 1+ 2GNI t 3 GNI t 66850.50 D 1t + 4 GNh 88254.00 D 2t i D 1 t 1996年以后 D 1 t 2000年以后 其中: D 1t _ t 1996年及以前 2t 0 t 2000年及以前 对上式进行回归后,有: Dependent Variable: YY Method: Least Squares Date: 06/16/05 Time: 23:27 120000 8.7 1996年和 100000- 40000 2WM GNi o eOB2&ISEea9a9l2949698[Ma2 20CUC ir-“- 1CC0C 图 8.6 *OOCO mnoot , RtKXD Tconr GF*

计量经济学课后答案-张龙版

计量经济学第一次作业 第二章P85 8.用SPSS软件对10名同学的成绩数据进行录入,分析得r=0.875,这说明学生的课堂练习和期终考试有密切的关系,一般平时练习成绩较高者,期终成绩也高。 9.(1)一元线性回归模型如下:Y i=?0+?1X i+u i 其中,Y i表示财政收入,X i表示国民生产总值,u i为随机扰动项, ?0 ?1为待估参数。 由Eviews软件得散点图如下图: (2)Y i =-1354.856+0.179672X i Sê:(655.7254) (0.007082) t:(-2.066194) (25.37152) R2=0.958316 F=643.7141 df=28 斜率? 1 =0.179672表示国民生产总值每增加1亿元,财政收入增加0.179672亿元。(3)可决系数R2=0.958316表示在财政收入Y的总变差中由模型作出的解释部分占95.8316%,即有95.8316%由国民生产总值来解释,同时说明样本回归模型对样本数据的拟合程度较高。 R2=ESS/(ESS+RSS) ESS=RSS*R2/(1-R2)=(1.91E+08)*0.958316/(1-0.958316)=44.02E+08 F=(n-2)ESS/RSS,ESS=F*RSS/(n-2)=4.39*E09 (4)Sê(? 0)=655.7245 Sê(? 1 )=0.007082

?1的95%的置信区间是: [?1-t 0.025(28)Sê(?1),?1+t 0.025(28)Sê(?1)] 代入数值得: [0.179672-2.048*0.007082,0.179672+2.048*0.007082] 即:[0.165,0.194] 同理可得,?0的95%置信区间为[-2697.78,-11.93] (5)①原假设H 0:?0=0 备择假设:H 1:?0≠0 则?0的t 值为:t 0=-2.066194 当ɑ=0.05时 t ɑ/2(28)=2.048 |t 0|=2.066194>t ɑ/2(28)=2.048 故拒绝原假设H 0,表明模型应保留截距项。 ②原假设H 0:?1=0 备择假设:H 1:?1≠0 当ɑ=0.05时 t ɑ/2(28)=2.048 因为|t 1|=25.37152>t ɑ/2(28)=2.048 故拒绝原假设H 0 表明国民生产总值的变动对国家财政收入有显著影响. 计量经济学第二次作业 第二章9.(10) 、建立X 与t 的趋势模型,其回归分析结果如下: Dependent Variable: X Method: Least Squares Date: 04/19/10 Time: 22:03 Sample: 1978 2008 Dependent Variable: Y Method: Least Squares Date: 04/10/10 Time: 17:31 Sample: 1978 2007 C -1354.856 655.7254 -2.066194 0.0482 R-squared 0.958316 Mean dependent var 10049.04 Adjusted R-squared 0.956827 S.D. dependent var 12585.51 S.E. of regression 2615.036 Akaike info criterion 18.64028 Sum squared resid 1.91E+08 Schwarz criterion 18.73370 Log likelihood -277.6043 F-statistic 643.7141

计量经济学-案例分析-第二章

第二章案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

计量经济学第四章练习题及参考解答

第四章练习题及参考解答 假设在模型i i i i u X X Y +++=33221βββ中,32X X 与之间的相关系数为零,于是有人建议你进行如 下回归: i i i i i i u X Y u X Y 23311221++=++=γγαα (1)是否存在3 322????βγβα ==且?为什么? (2)1 11???βαγ会等于或或两者的某个线性组合吗? (3)是否有()()()()3 3 2 2 ?var ?var ?var ?var γβα β==且? 练习题参考解答: (1) 存在3 322????βγβα==且。 因为()()()() ()()() 2 3223223232322?∑∑∑∑∑∑∑--= i i i i i i i i i i i x x x x x x x y x x y β 当 32X X 与之间的相关系数为零时,离差形式的032=∑i i x x 有()()()()222223222322 ??αβ=== ∑∑∑∑∑∑i i i i i i i i x x y x x x x y 同理有:3 3??βγ= (2) 1 11???βαγ会等于或的某个线性组合 因为 12233???Y X X βββ=--,且122??Y X αα=-,133??Y X γγ=- 由于3322????βγβα ==且,则 112222 2 2 ?????Y Y X Y X X αααββ-=-=-= 则 11 122332 3112 3 ???????Y Y Y X X Y X X Y X X αγβββαγ--=--=--=+- (3) 存在()()()()3 3 2 2 ?var ?var ?var ?var γβα β==且。 因为()() ∑-= 223 2 22 2 1?var r x i σβ 当023=r 时,() ()()2222 2 23 222 2 ?var 1?var α σσβ== -=∑∑i i x r x 同理,有()()3 3 ?var ?var γβ= 在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔

计量经济学案例分析一元回归模型实例分析报告

∑ x = 1264471.423 ∑ y = 516634.011 ∑ X = 52432495.137 ∑ ? ? ? ? 案例分析 1— 一元回归模型实例分析 依据 1996-2005 年《中国统计年鉴》提供的资料,经过整理,获得以下农村居民人均 消费支出和人均纯收入的数据如表 2-5: 表 2-5 农村居民 1995-2004 人均消费支出和人均纯收入数据资料 单位:元 年度 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 人均纯 收入 1577.7 1926.1 2090.1 2161.1 2210.3 2253.4 2366.4 2475.6 2622.2 2936.4 人均消 费支出 1310.4 1572.1 1617.2 1590.3 1577.4 1670.1 1741.1 1834.3 1943.3 2184.7 一、建立模型 以农村居民人均纯收入为解释变量 X ,农村居民人均消费支出为被解释变量 Y ,分析 Y 随 X 的变化而变化的因果关系。考察样本数据的分布并结合有关经济理论,建立一元线 性回归模型如下: Y i =β0+β1X i +μi 根据表 2-5 编制计算各参数的基础数据计算表。 求得: X = 2262.035 Y = 1704.082 2 i 2 i ∑ x i y i = 788859.986 2 i 根据以上基础数据求得: β1 = ∑ x i y 2 i i = 788859.986 126447.423 = 0.623865 β 0 = Y - β1 X = 1704.082 - 0.623865 ? 2262.035 = 292.8775 样本回归函数为: Y i = 292.8775 + 0.623865X i 上式表明,中国农村居民家庭人均可支配收入若是增加 100 元,居民们将会拿出其中 的 62.39 元用于消费。

计量经济学4答案

第四章 多重共线性 一、单项选择题 1、完全的多重共线性是指解释变量的数据矩阵的秩( B ) (A )大于k+1 (B )小于k+1 (C )等于k+1 (D )等于k+1 2、当模型存在严重的多重共线性时,OLS 估计量将不具备( D ) (A )线性 (B )无偏性 (C )有效性 (D )一致性 3、如果每两个解释变量的简单相关系数比较高,大于( D )时则可认为存在着较严重的多重共线性。 (A )0.5 (B )0.6 (C )0.7 (D )0.8 4、方差扩大因子VIF j 可用来度量多重共线性的严重程度,经验表明,VIF j ( A )时,说明解释变量与其余解释变量间有严重的多重共线性。 (A )小于5 (B )大于1 (C )小于1 (D )大于10 5、对于模型01122i i i i y x x u βββ=+++,与r 23等于0相比,当r 23等于0.5时,3 ?β的方差将是原来的(C ) (A )2倍 (B )1.5倍 (C )1.33倍 (D )1.25倍 6、无多重共线性是指数据矩阵的秩( D ) (A )小于k (B )等于k (C )大于k (D )等于k+1 7、无多重共线性假定是假定各解释变量之间不存在( A ) (A )线性关系 (B )非线性关系 (C )自相关 (D )异方差 8、经济变量之间具有共同变化的趋势时,由其构建的计量经济模型易产生( C ) (A )异方差 (B )自相关 (C )多重共线性 (D )序列相关 9、完全多重共线性产生的后果包括参数估计量的方差( C ) (A )增大 (B )减小 (C )无穷大 (D )无穷小 10、不完全多重共线性产生的后果包括参数估计量的方差( A ) (A )增大 (B )减小 (C )无穷大 (D )无穷小 11、不完全多重共线性下,对参数区间估计时,置信区间趋于( A ) (A )变大 (B )变小 (C )不变 (D )难以估计 12、较高的简单相关系数是多重共线性存在的( B ) (A )必要条件 (B )充分条件 (C )充要条件 (D )并非条件 13、方差扩大因子VIF j 是由辅助回归的可决系数R j 2计算而得,R j 2越大,方差扩大因子VIF j 就( A ) (A )越大 (B )越小 (C )不变 (D )无关 14、解释变量间的多重共线性越弱,方差扩大因子VIF j 就越接近于( A ) (A )1 (B )2 (C )0 (D )10 15、多重共线性是一个(D ) (A )样本特性 (B )总体特性 (C )模型特性 (D )以上皆不对 二、多项选择题 1、多重共线性包括(ABCD ) (A )完全的多重共线性 (B )不完全的多重共线性

推荐-计量经济学案例分析 精品

计量经济学案例分析 一、问题提出 国内生产总值(GDP)指一个国家或地区所有常住单位在一定时期内(通常为1 年)生产活动的最终成果,即所有常住机构单位或产业部门一定时期内生产的可供最终使用的产品和劳务的价值,包括全部生产活动的成果,是一个颇为全面的经济指标。对国内生产总值的分析研究具有极其重要的作用和意义,可以充分地体现出一个国家的综合实力和竞争力。因此,运用计量经济学的研究方法具体分析国内生产总值和其他经济指标的相关关系。对预测国民经济发展态势,制定国家宏观经济政策,保持国民经济平稳地发展具有重要的意义。 二、模型变量的选择 模型中的被解释变量为国内生产总值Y。影响国内生产总值的因素比较多,根据其影响因素的大小和资料的可比以及预测模型的要求等方面原因, 文章选择以下指标作为模型的解释变量:固定资产投资总量(X1 ) 、财政支出总量(X2 )、城乡居民储蓄存款年末余额(X3 )、进出口总额(X4 )、上一期国内生产总值(X5)、职工工资总额(X6)。其中,固定资产投资的增长是国内生产总值增长的重要保障,影响效果显著;财政支出是扩大内需的保证,有利于国内生产总值的增长;城乡居民储蓄能够促进国内生产总值的增长,是扩大投资的重要因素,但是过多的储蓄也会减缓经济的发展;进出口总额反映了一个国家或地区的经济实力;上期国内生产总值是下期国内生产总值增长的基础;职工工资总额是国内生产总值规模的表现。 三、数据的选择 文中模型样本观测数据资料来源于20XX 年《中国统计年鉴》,且为当年价格。固定资产投资总量1995-20XX 年的数据取自20XX 年统计年鉴,1991-1994 年的为搜集自其他年份统计年鉴。详细数据见表1。 表1

伍德里奇计量经济学英文版各章总结

CHAPTER 1 TEACHING NOTES You have substantial latitude about what to emphasize in Chapter 1. I find it useful to talk about the economics of crime example (Example 1.1) and the wage example (Example 1.2) so that students see, at the outset, that econometrics is linked to economic reasoning, even if the economics is not complicated theory. I like to familiarize students with the important data structures that empirical economists use, focusing primarily on cross-sectional and time series data sets, as these are what I cover in a first-semester course. It is probably a good idea to mention the growing importance of data sets that have both a cross-sectional and time dimension. I spend almost an entire lecture talking about the problems inherent in drawing causal inferences in the social sciences. I do this mostly through the agricultural yield, return to education, and crime examples. These examples also contrast experimental and nonexperimental (observational) data. Students studying business and finance tend to find the term structure of interest rates example more relevant, although the issue there is testing the implication of a simple theory, as opposed to inferring causality. I have found that spending time talking about these examples, in place of a formal review of probability and statistics, is more successful (and more enjoyable for the students and me). CHAPTER 2 TEACHING NOTES This is the chapter where I expect students to follow most, if not all, of the algebraic derivations. In class I like to derive at least the unbiasedness of the OLS slope coefficient, and usually I derive the variance. At a minimum, I talk about the factors affecting the variance. To simplify the notation, after I emphasize the assumptions in the population model, and assume random sampling, I just condition on the values of the explanatory variables in the sample. Technically, this is justified by random sampling because, for example, E(u i|x1,x2,…,x n) = E(u i|x i) by independent sampling. I find that students are able to focus on the key assumption SLR.4 and subsequently take my word about how conditioning on the independent variables in the sample is harmless. (If you prefer, the appendix to Chapter 3 does the conditioning argument carefully.) Because statistical inference is no more difficult in multiple regression than in simple regression, I postpone inference until Chapter 4. (This reduces redundancy and allows you to focus on the interpretive differences between simple and multiple regression.) You might notice how, compared with most other texts, I use relatively few assumptions to derive the unbiasedness of the OLS slope estimator, followed by the formula for its variance. This is because I do not introduce redundant or unnecessary assumptions. For example, once SLR.4 is assumed, nothing further about the relationship between u and x is needed to obtain the unbiasedness of OLS under random sampling. CHAPTER 3

相关主题