搜档网
当前位置:搜档网 › 伍德里奇 计量经济学(第4版)答案

伍德里奇 计量经济学(第4版)答案

伍德里奇 计量经济学(第4版)答案
伍德里奇 计量经济学(第4版)答案

计量经济学答案

第二章

2.4 (1)在实验的准备过程中,我们要随机安排小时数,这样小时数(hours )可以独立于其它影响SAT 成绩的因素。然后,我们收集实验中每个学生SAT 成绩的相关信息,产生一个数据集{}n i hours sat i i ,...2,1

:),(=,n 是实验中学生的数量。从式(2.7)中,我们应尽量获得较多可行的i hours 变量。

(2)因素:与生俱来的能力(天赋)、家庭收入、考试当天的健康状况

①如果我们认为天赋高的学生不需要准备SAT 考试,那天赋(ability )与小时数(hours )之间是负相关。②家庭收入与小时数之间可能是正相关,因为收入水平高的家庭更容易支付起备考课程的费用。③排除慢性健康问题,考试当天的健康问题与SAT 备考课程上的小时数(hours )大致不相关。

(3)如果备考课程有效,1β应该是正的:其他因素不变情况下,增加备考课程时间会提高SAT 成绩。

(4)0β在这个例子中有一个很有用的解释:因为E (u )=0,0β是那些在备考课程上花费小时数为0的学生的SAT 平均成绩。

2.7(1)是的。如果住房离垃圾焚化炉很近会压低房屋的价格,如果住房离垃圾焚化炉距离远则房屋的价格会高。

(2)如果城市选择将垃圾焚化炉放置在距离昂贵的街区较远的地方,那么log(dist)与房屋价格就是正相关的。也就是说方程中u 包含的因素(例如焚化炉的地理位置等)和距离(dist)相关,则E (u ︱log(dist))≠0。这就违背SLR4(零条件均值假设),而且最小二乘法估计可能有偏。

(3)房屋面积,浴室的数量,地段大小,屋龄,社区的质量(包括学校的质量)等因素,正如第(2)问所提到的,这些因素都与距离焚化炉的远近(dist,log(dist))相关

2.11(1)当cigs (孕妇每天抽烟根数)=0时,预计婴儿出生体重=110.77盎司;当cigs (孕

妇每天抽烟根数)=20时,预计婴儿出生体重( bwght )=109.49盎司。

(110.77-109.49)/110.77=8.6%,抽烟数从0到20,预计儿童出生体重下降了约8.6%。

(2)并不能。还有其他因素可以影响婴儿出生体重,尤其是母亲的整体健康状况和产前保健的质量。这些因素还都可能与母亲怀孕期间的抽烟习惯有关。其它因素,比如咖啡因的摄入量也会影响婴儿出生体重,而且可能与母亲怀孕期间的抽烟习惯有关。

(3)如果预测出生体重为125盎司,则cigs=(125 – 119.77)/( –0.524) ≈–10.18 ,约为-10支,这是不可能的。当然,这只是告诉我们,对于预测婴儿出生体重这样复杂的因变量,如果只有一个解释变量,将会发生什么。预计婴儿出生体重的最大值是119.77盎司,然而样本中确有超过700个新生婴儿的体重超过了119.77盎司,这就说明模型建立不恰当

(4)85%的妇女怀孕期间不抽烟,即1388个样本中有大约1180个妇女不抽烟。因为我们只用cigs 一个变量解释婴儿出生体重,所以当cigs=0时,我们只有一个相对应的出生体重数。在cigs=0时,预计的出生体重数大致位于观测的出生体重数的中间。因此,我们可能会低估较高的出生体重数。

第三章

3.3(1)法学院的排名(rank 值)越大,说明学校威望越低:这会降低起薪。例如:rank=100说明有99所学校排在其前面。

(2)2β>0,3β>0;LSAT 和GPA 都是测量进入法学院的学生的整体素质,不论优秀的学生在哪里进入法学院,我们预期他们会赚得更多。平均来讲,3β和4β>0,法学院图书馆的藏书量及法学院每年的费用都能衡量学校的好坏(相对于藏书量,法学院每年的费用对起薪的正的效应并不那么明显,但它应反映教职工、基础设备等相关资源质量的好坏)。

(3)在其他条件不变的情况下,预计GPA 中位数相差一分会导致薪水有24.8%的差别。(恰好等于GPA 的相关系数)

(4)Log(libvol)的系数表明:法学院藏书量每增加1%,则学生起薪会提高0.095%。

(5)很明显,进入排名较靠前(数字较小)的法学院更好。如果法学院A 的排名比B 靠前20位,则A 法学院的起薪要高大约6.6%(0.0033*20*100%)

3.4(1)如果成年人为工作而放弃睡眠,工作多意味着睡眠会减少。所以1β>0.

(2)一般说来,2β和3β的的符号并不确定。虽然有人认为受过较高教育的人想要得到更完美的生活,所以他们的睡觉时间很少(2β<0)。睡眠时间与年龄之间的关系要比模型中给的复杂多,经济学家也并未对此作出更好的解释。

(3)因为工作时间以分钟为单位,我们把5小时化为分钟,则总工作时间为300分钟。睡眠时间预计会减少0.148*300=44.4分钟。从一周来看,少睡45分钟并不算是很大的舍弃。

(4)较多的教育意味着较少的睡眠时间,但教育对睡眠时间的影响是较小的。如果我们假设大学与高中的差别是4年,那么大学毕业生平均每年要少睡大约45(11.13*4)分钟。

(5)很明显,这3个解释变量只解释了睡眠时间11.3%的变异(2

R =0.113)。其他可能影响花在睡眠上时间的因素包括:健康状况、婚姻状况以及是否有孩子。一般来讲,这3个变量都与工作时间有关。(比如:身体状况较差的人工作时间较少)

第四章

4.3(1)尽管hrsemp (平均每个雇员每年接受培训的小时数)的标准误差没有改变,但系数增加了大约一半(-0.029到-0.042),t 统计量从-1.26到-2.21(-0.042/0.019),显著性水平为5%的临界值小于零。(当自由度为40时,显著性水平为5%的临界值约为-1.684;显著性水平为1%的临界值为-2.423,;p 值在0.01---0.05之间)。

(2)log(scrap )=0β+1βhrsemp+2βlog(sales)+3βlog(employ )+ u

=0β +

1βhrsemp + [2βlog(sales) – 2βlog(employ )] + [2βlog(employ ) + 3βlog(employ )] + u

=0β +

1βhrsemp + 2βlog(sales /employ )

+ (2β + 3β)log(employ ) + u , 我们令2β+3β=

3θ,则原式可写成:log(scrap )=0β+1βhrsemp+2βlog(sales/employ)+3θlog(employ )+ u

假设0H :3θ=0,意味着23ββ-=,当其他条件不变时,销售额增加1%与企业雇员人数减少1%对废品率的影响是相同的。

(3)不是。我们对log(employ)的系数感兴趣,其t 统计量为0.2(很小),因此我们可以得到:一旦我们控制了工人培训和销售—雇员比之后(以对数形式表示),以员工数量为测量标准的企业规模与废品率在统计上的显著性并不重要。

(4)零假设检验:0H :2β= –1. T 统计量=[–0.951– (–1)]/0.37= (1– 0.951)/0.37≈0 .132; 这个数字很小,我们不能拒绝单侧或双侧假设。即sales/employ 提高1%将伴随以废品率下降1%。

4.8(1)式中自由度df=706-4=702,自由度为702的双侧检验的5%的临界值是1.96。这样, t educ = -11.13/

5.88≈ -1.89, 所以|t educ |= 1.89< 1.96,在显著性水平为5%的时候,我们不能拒绝假设H 0: educ β = 0。同理:t age=2.20/1.45≈1.52<1.96。因此,对于双侧对立假设,educ 与age 在5%的水平上都不是个别显著的。

(2)ur

ur r ur df R q R R F /)1(/)(222--==702/)113.01(2/)103.0113.0(--≈3.96:;查表可知),(ur df q F =F (2,702)=3.00。3.96>3.00,所以在5%的显著性水平上,educ 与age 在原式中是联合显著的。

(3)几乎不影响。虽然educ 与age 在原式中是联合显著的,但在考虑它们之后,原式totwrk (总工作时间)的系数从-0.151变到了-0.148,这个影响是很小的。

(4)因为T 检验与F 检验是建立在同方差假定与其他线性模型假定基础上的,所以如果睡眠方程中含有异方差性,就意味着我们对方程的检验是无效的。

4.11(1)假定profmarg 不变,当sales 变化10%时,?rdinters=

(0.321/100)*10=0.0321,j 即rdintens 变化大约3%。相对于sales 的变化,rdintens 的变化是个较小的影响。

(2)H 0::1β=0 1H :1β>0 其中1β是log(sales)的系数。进行T 检验:t=216

.032.0≈1.486;自由度为df=32-3=29的单侧检验显著性水平为5%的临界值为1.699,因而在5%的显著性水平上我们不能拒绝原假设。自由度为df=32-3=29的单侧检验显著性水平为10%的临界值为

1.311,因而在10%的显著性水平上我们拒绝原假设而接受1β>0。

(3)Profmarg 的系数表示:profmarg 变化1%,rdintens 变化0.05%,这在经济上影响并不显著。

(4)对profmarg 的显著性进行T 检验:t=

046.005.0≈1.087<1.311,因为它在统计上并不显著。 第五章

5.3风险承受能力越强,越愿意投资于股票市场,因此

假设funds 和 risktol 正相关,我们使用等式因此具有高度不一致(渐进有偏),这表明如果我们在回归方程中省略risktol ,并且它和funds 高度相关,funds 的估计效应取决于risktol 的效应。(省略risktol,回归方程倾向于高估funds 的影响)

第六章

6.3(1)当其他要素固定时,我们有

等式两边同除以得到结果,是不显著的,尽管大于0,如果来我们考虑一个孩子多得一年教育,孩子的父母会有更高的学历。

(2)我们选择pareduc 的两个具体值来解释交叉项系数,比如父母双方都受过大学教育时pareduc=32或父母都是高中毕业时pareduc=24,educ 的估计回报差额是0.00078(32-24)=0.0062,或者说0.62%。

(3)如果在方程中加入paredc 作为一个独立变量引入,交叉项系数是负的。Educ*pareduc 的t 统计量大约是-1.33.在10%的显著性水平上,在双侧对立假设上,t 统计量是不显著的。注意到,pareduc 的系数在5%的显著性水平上,在双侧对立假设下是显著的。这表明省略一个效应水平会如何导致交互效应的有偏估计。

6.5 (1)当转折点是 1?β/(2|2

?β|), or .0003/(.000000014) ≈ 21,428.57时开始为负的(以百万美元为计量单位)(对方程式求导,然后等式让等于0,即得到21,428.57)

(2)会,它的t 统计量大约为-1.89,这个在5%显著性水平上违背了单侧对立假设H 0: 1β < 0(co ≈ –1.70 with df = 29),即它是统计显著的,实际上,P 值是0.036。

(3)因为销售获取除以 1 000,得到 salesbil ,相应的系数乘以 1000 : (1,000)(0.00030) =0.30。标准错误乘以相同的因子。提示,salesbil2 = 销售额/1,000,000,所以对二次系数获取乘以 100 万: (1,000,000)(.0000000070) =.0070 ;它的标准误差也获取乘以 100 万。截距 或R 2(因为 rdintens 不其重新缩放)不会发生变化:

rdintens

= 2.613+ 0.30 salesbil – 0.0070 salesbil 2 (0.429) (0.14) (0.0037)

n = 32, R 2 = 0.1484.

(4)第三小题的方程更容易阅读,因为它右侧包含更少的0,两个方程的解释是相同的,只是记账尺度不同。

第7章

7.1(1)男性系数是87.75,所有估计一男子差不多一周比女人多睡一个半小时,此外,t male =87.75/34.33≈ 2.56,这个数接近对于双侧对立假设的1%水平的临界值(2.58),因此,

性别差异的证据是相当强烈的。

(2)totwrk 的 t 统计是 ?0.163/0.018 ≈ ?9.06,这是统计性水平是很显著的。这个系数意味着多工作一个小时(60 分钟)就会少睡0.163(60) ≈ 9.8分钟。

(3)为了获得2r R 的值, R -squared 来自约束回归方程,我们需要估计没有age 和age^2的模型,当age 和 age2 都在模型中时,只有这两个参数均为零时才有没有影响。

7.2 (i) 如果 ?cigs = 10 那么 log(

)bwght ? = -0.0044(10) = -0.044, 意味着每天多抽十根烟,婴儿出生体重下降 4.4% 。

(2)在第一个方程中,保持其他因素不变,预计一个白人孩子比一个非白人孩子的出生体重高5.5%。而且t white ≈ 4.23,这个比普通的临界值高,因此,白人孩子和非白人孩子的差异也是统计显著性的。

(3)如果孩子的母亲的教育水平多一年,孩子出生体重预计会高0.3%,这不是一个太大的影响,t 统计量等于-1,因此其统计显著性不明显。

(4)这两个回归方程使用的是不同的观测值,第二个回归方程用的是较小的观测值因为在某些观测值中母亲或父亲的值消失了,我们需要使用估计的观测值来重新估计第一个方程(获得R -squared 的值)。

7.3(1)hsize 2 的t 统计量的绝对值大于4,有很强的证据表明是统计显著的,我们是通过

找到转折点来获得的。在其他条件不变的情况下hsize 扩大了?sat

的值:19.3/(2?2.19) ≈ 4.41.因为hsize 是以百人计学生规模,毕业生的最优规模大约是441.

(2)这个是由female 的系数给出的(当black = 0时):非黑人女性比非黑人男性的SAT 分数低45分,t 统计量大约是-10.51.因此这个估计差异的统计显著性非常大。

(3)由于female = 0, black 的系数表明一个黑人男性的SAT 分数比同类非黑人男性低170分。T 统计量的绝对值高0.13,因此,我们很容易就可以拒绝分数没有差异的虚拟假设。(t=-13.36,故拒绝原假设,即他们的分数存在差异)

(4)我们为black females 插入black = 1, female = 1值,为nonblack females 插入black = 0 and female = 1值,因此差异为–169.81 + 62.31 = -107.50.因为这个估计结果取决于两个系数,我们不能从给定的信息中构造出t 统计量,最简便的方法是为三或四个种族或性别类定义虚拟变量,选择nonblack females 作为基础变量,因此,当black female 的系数也是虚拟变量时我们就能获得所要的T 统计量

第八章

4(1)这些系数有预期的估计效应。如果一个学生选修的课程平均成绩很高-通过较高的crsgpa 反映出来-则他的成绩就会很高。学生在过去表现越是良好-通过cumgpa 衡量-则学生在此学期平均成绩就会越好。最后,tothrs 是对经验的衡量,这个系数表示报酬递增。 对于crsgpa ,t 统计量很大,使用普通标准误其值大于5(这是这两个中最大的).对cumgpa 使用稳健的标准误,它的t 统计量大约是2.61,在5%的显著性水平上是统计显著的。对于tothrs ,使用任意标准误其t 统计量仅约为1.17,因此在5%的水平上不是统计显著的。

(2)很容易发现在模型中没有解释变量。如果crsgpa 是仅有的解释变量,H 0:crsgpa β= 1 意味着在没有任何信息的情况下,对学生长期GDP 最好的预测是学生课程的平均GDP ,它可以通过定义获得(截距在这种情况下将是0).加入更多的解释变量,crsgpa β= 1不一定正确,因为crsgpa 与学生的品质相关(例如,学生选修的课程可能是受考试成绩衡量的能力和过去的在校表现影响的)。但是,对检验这一假说很有意思。

使用普通标准误得到的t 统计量是t = (0.900 – 1)/0.175 ≈ -0.57;使用异方差稳健标准误得出t ≈ -0.60。在这两种情况下,在任何合理的显著性水平上我们都不能拒绝H 0: crsgpa β= 1,当然也包括5%。

(3)在旺季效应的系数上赛季,这意味着,当运动员的运动存在竞争时,他的GDP 最低大约是0.16点。使用普通标准误其t 统计量大约是-1.6,然而使用稳健标准误其t 统计量大约是-1.96.

对于双侧对立假设,使用稳健标准误得出的t 统计量在5%水平上是显著的(标准正常临界值是1.96),而使用普通标准误其t 统计量在10%水平上不是显著的(临界值是1.65)。因此,在这种情况下使用不同的标准误有不同的结果。这个例子有点不寻常,因为稳健标准误往往是这两个中较大的那个。

6(1)所提出的检验是对帕甘检验和怀特检验的结合。有k+1个回归量,原始解释变量和拟合值的平方。因此,检验的限制数是K+1,这是分子的自由度,分母的自由度是n - (k + 2) = n - k - 2

(2)对于帕甘检验,这很容易:混合检验有一个额外的回归量2?y , 因此对于混合检验而言,R-平方不会小于帕甘检验下的R-平方。对于怀特检验特殊形式,这个参数更加微妙。在回归中(8.20), 拟合值是回归量的线性函数(当然,在线性函数中这个系数是OLS 的估计值)。因此,我们正对原始解释变量如何在回归中出现作出限制。这意味着,怀特检验特殊形式下的R-平方不会大于混合检验下的R-平方。

(3)不是,对这些回归量进行联合显著性检验其F 统计量取决于2222垐/(1)u u

R R -,它是真实的且这个比率随着2

2

?u R 增加而增加。但F 统计量也取决于自由度,且这个自由度在这三个检验中都是不同的:帕甘检验是怀特检验和混合检验的特例。所以,我们不知道哪个检验会产生最小的p 值。

(4)如在(2)中所讨论的那样,OLS 拟合值是原来回归量的线性组合。因为这些回归量出现在混合检验中,增加OLS 拟合值是多余的,会导致完全共线性。

第九章

1.如果β6≠0或β7≠0,在添加人口参数分别是ceoten2 and comten2后,存在函数形式误设。因此,我们使用R2形式的F 检验对这些变量进行联合显著性检验:F = [(.375 ? .353)/(1 ? .375)][(177 –8)/2] ≈

2.97。(2 ∞)时,10%的临界值是2.30,而5%的临界值是

3.00。因此,p-值是略高于0.05,这是函数形式误设的合理证据。(当然,对于不同程度解释变量的估计偏效应是否有实际影响是另一回事)

3.(1)联邦政府资助的学校午餐计划的申请资格是与经济上处于不利地位紧密相连的。因此,享受午餐计划的学生比例与处于贫困中的学生比例非常相近。

(2)从回归方程中忽略重要变量时,我们可以使用常用的推理。log(expend)变量和lnchprg 是呈负相关的:平均而言,有贫困儿童的校区花的更少。另外,β3<0。从表3.2可知,从回归模型中忽略lnchprg (贫困的代理)会产生一个向上的偏估计β1 [在模型中忽略了log(enroll)的存在]。因此,当我们控制贫困比率时,支出的影响会下降。

(3)一旦,我们控制了lnchprg ,log(enroll)的系数会变为负的且其t 统计量大约为-2.17.在5%的水平上双侧对立是显著的。这个系数意味着

因此,入学人数增加10%会导致math10下降0.126个百分点。

(4)math10 和 lnchprg是百分数,因此,lnchprg增加10个百分点会导致math10下降约3.23个百分点,这是一个相当大的影响。

(5)列(1)中所有的变量只解释了对math10影响的很小部分:不足3%。列(2),我们解释了近19%(这样仍有许多变量没有解释)。显然,math10的大部分变量是通过lnchprg的变量得到解释。在学校行为研究中这是个很普通的发现:家庭收入(或相关因素,如生活在贫困中)在解释学生行为方面比花在每个学生身上的支出或学校其他特点方面更重要。

第十章

1.不同意。大部分的时间序列过程随时间推移是相关的,且很多都有很强的相关性。这意味着他们不是独立的横截面观测,而是代表了不同的时间段。即使是大致不相关的序列- 如股票收益率 - 似乎并不是独立分布,如你将在第12章中看到的动态形式下的异方差性。

2.同意。这句话可以从定理10.1中得到。特别是,我们不需要同方差和无序列相关的假设。

3.不同意。趋势变量在回归模型中常常被用作因变量。我们在解释结果时必须要谨慎,因为我们可能在Yt和趋势解释变量中只是找到一个虚假的关系。在回归中包含有趋势的因变量或自变量是合理的。正如第10.5节中讨论的那样,因变量有趋势时,通常r^2可能会产生误导。

4.同意。使用年度数据时,每一个时间段代表一年,与任何季节性变化都没有联系。

第十一章

证明:由于协方差平稳,= Var()不依赖于t,因此sd()=,对于任何的h>=0.根据定义,

第十二章

12.1从方程12.4中可以找出原因:通常OLS标准误差是对的估计量。当因变

量和自变量是水平in level(或对数)形式时,AR(1)的参数,ρ,在时间序列回归模型中往往是正的。此外,回归模型中不同时期的自变量往往是正相关的,因此,

-

当{}的样本均值不是0时,它通常出现在(12.4)方程中—对于多数时期t和t+j来说,往往是正的。有多个解释变量的公式更为复杂,但也有类似的特征。

如果ρ < 0或{}是负自相关的,(12.4)方程中最后一行的第二项可能是负的,在这种情况下,真正的标准偏差实际上会小于

这是个分析1981到2001年国内生产总值(GDP)与消费水平(XF)之间的相关关系的例子。因变量:GDP

方法:最小二乘法

时间:11年6月3日13点19分

样本:1981年——2001年的数据

由表格可以建立GDP跟XF的方程:

GDP=-134.93+1.66XF

Variable 变量Coefficient 系数Std.Error标准差t-Statistic t统计量Prob. 概率

其中:t-Statistic= Coefficient 系数/ Std.Error标准差

R-squared ——是剩余平方和与总平方和的比值,即R^2=SSE/SST 详见课本76页

Ajusted R-squared ——调整的R^2 一般Ajusted R-squared比R-squared要小, 调整后的可决系数剔除了解释变量个数对解释能力的影响。

S.E.of regression ——回归标准误

Sum squared resid——残差平方和

Durbin-Watson stat——DW统计量,检验模型是否含有一阶自相关,其值越接近2越好Mean dependent var——因变量均值

S.D.dependent var——因变量标准差

F-Statistic——F统计量

Prob(F-Statistic)——F统计量的概率

庞皓计量经济学课后答案第四章(内容参考)

统计学2班 第三次作业 1、⑴存在.2 3223223232 322 ) ())(() )(())((?∑∑∑∑∑∑∑--=i i i i i i i i i i i x x x x x x x y x x y βΘ 当X 2和X 3之间的相关系数为0时,离差形式的 ∑i i x x 32=0 2 222232 22 322 ?) )(() )((??== =∴∑∑∑∑∑∑i i i i i i i i x x y x x x x y β 同理得:33 ??γβ= ⑵2 ?β会等于1?α和1?γ二者的线性组合。 33221???X X Y βββ--=Θ且221??X Y αα-=,331??X Y γγ-= 由⑴可得22 ??αβ=和33??γβ= 22221???X Y X Y βαα-=-=∴,3 3331???X Y X Y βγγ-=-= 212 ??X Y αβ-=∴,3 1 3??X Y γβ-= 则:33 1 2213 3221?????X X Y X X Y Y X X Y γαβββ----=--=Θ ⑶存在。∑-=)1()?(223 222 2 r x Var i σβΘ X 2和X 3之间相关系数为0,)?() 1()?(2222 223 2 22 2 α σσβVar x r x Var i i == -=∴∑∑ 同理可得)?()?(33 γβVar Var = 2、逐步向前回归和逐步向后回归的程序都存在不足,逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入新的变量,就保留在方程中,逐步向后法泽一旦剔除一个解释变量就再没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而不同。所以采用逐步回归比较好。吸收了逐步向前和逐步向后的优点。

《计量经济学》第四章精选题及答案

第四章:多重共线性 二、简答题 1、导致多重共线性的原因有哪些? 2、多重共线性为什么会使得模型的预测功能失效? 3、如何利用辅回归模型来检验多重共线性? 4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。 (1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。 (2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。 (3)如果某一辅回归显示出较高的2 i R 值,则必然会存在高度的多重共线性。 (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。 (5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。 12233i i i Y X X βββ=++ 来对以上数据进行拟合回归。 (1) 我们能得到这3个估计量吗?并说明理由。 (2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计 算过程。 6、考虑以下模型: 23 1234i i i i i Y X X X ββββμ=++++ 由于2X 和3 X 是X 的函数,那么它们之间存在多重共线性。这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。我们考虑以下模型: 12313233i t t t t t Y X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。 (1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型 12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。如果我们做如下的回归:

伍德里奇计量经济学第四章

name: log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcl log type: smcl opened on: 25 Oct 2016, 22:20:41 1. do "/var/folders/qt/0wzmrhfd3rb93j2h5hhtcwqr0000gn/T//SD19456.000000" 2. ****************************Chapter 4*********************************** 3. **C1 4. use "/Users/wangjianying/Documents/data of wooldridge/stata/VOTE1.DTA" 5. des Contains data from /Users/wangjianying/Documents/data of wooldridge/stata/VOTE1.DTA obs: 173 vars: 10 25 Jun 1999 14:07 size: 4,498 storage display value variable name type format label variable label state str2 %9s state postal code district byte %3.0f congressional district democA byte %3.2f =1 if A is democrat voteA byte %5.2f percent vote for A expendA float %8.2f camp. expends. by A, $1000s expendB float %8.2f camp. expends. by B, $1000s prtystrA byte %5.2f % vote for president lexpendA float %9.0g log(expendA) lexpendB float %9.0g log(expendB) shareA float %5.2f 100*(expendA/(expendA+expendB)) Sorted by: 6. reg voteA lexpendA lexpendB prtystrA Source SS df MS Number of obs = 173 F( 3, 169) = 215.23 Model 38405.1096 3 12801.7032 Prob > F = 0.0000 Residual 10052.1389 169 59.480112 R-squared = 0.7926 Adj R-squared = 0.7889 Total 48457.2486 172 281.728189 Root MSE = 7.7123 voteA Coef. Std. Err. t P>|t| [95% Conf. Interval] lexpendA 6.083316 .38215 15.92 0.000 5.328914 6.837719 lexpendB -6.615417 .3788203 -17.46 0.000 -7.363246 -5.867588 prtystrA .1519574 .0620181 2.45 0.015 .0295274 .2743873 _cons 45.07893 3.926305 11.48 0.000 37.32801 52.82985 7. gen cha=lexpendB-lexpendA // variable cha is a new variable// 8. reg voteA lexpendA cha prtystrA Source SS df MS Number of obs = 173

计量经济学 案例分析

第二章 案例分析 研究目的:分析各地区城镇居民计算机拥有量与城镇居民收入水平的关系,对更多规律的研究具有指导意义. 一. 模型设定 2011年年底城镇居民家庭平均每百户计算机拥有量Y 与城镇居民平均每人全年家庭总收入X 的关系 图2.1 各地区城镇居民每百户计算机拥有量与人均总收入的散点图 由图可知,各地区城镇居民每百户计算机拥有量随着人均总收入水平的提高而增加,近似于线性关系,为分析其数量性变动规律,可建立如下简单线性回归模型: Y t =β1+β2X t +u t 50 60 708090100 110120130140 X Y

二.估计参数 假定所建模型及其随机扰动项u i满足各项古典假设,用普通最小二乘法(OLSE)估计模型参数.其结果如下: 表2.1 回归结果 Dependent Variable: Y Method: Least Squares Date: 11/13/17 Time: 12:50 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 11.95802 5.622841 2.126686 0.0421 X 0.002873 0.000240 11.98264 0.0000 R-squared 0.831966 Mean dependent var 77.08161 Adjusted R-squared 0.826171 S.D. dependent var 19.25503 S.E. of regression 8.027957 Akaike info criterion 7.066078 Sum squared resid 1868.995 Schwarz criterion 7.158593 Log likelihood -107.5242 Hannan-Quinn criter. 7.096236 F-statistic 143.5836 Durbin-Watson stat 1.656123 Prob(F-statistic) 0.000000 由表2.1可得, β1=11.9580,β2=0.0029 故简单线性回归模型可写为: ^ Y X t t=11.9580+0.0029 其中:SE(β1)=5.6228, SE(β2)=0.0002 R-squared=0.8320,F=143.5836,n=31

计量经济学第四章

第四章 经典单方程计量经济学模型:放宽基本假定的模型 一、内容提要 本章主要介绍计量经济模型的二级检验问题,即计量经济检验。主要讨论对回归模型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用OLS 估计模型所带来的不良后果以及如何修正等问题。包括:异方差性问题、序列相关性问题、多重共线性问题。 1.异方差: 含义:随机扰动项的方差随样本点而不同。 后果:OLS 估计是线性、无偏、一致的但不有效;由于随机项异方差的存在而导致的参数估计值的标准差的偏误,通常的假设检验t 检验和F 检验失效;模型的预测变得无效。 检验:图示法、Goldfeld-Quandt 检验法以及White 检验法等。 修正:而当检测出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计。 序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类似,在序列相关存在的情况下,OLS 估计量仍具无偏性与一致性,但通常的假设检验不再可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法、Durbin-Watson 检验法以及Lagrange 乘子检验法等。存在序列相关性时,修正的估计方法有广义最小二乘法(GLS )以及广义差分法。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t-统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项同期相关。第一种类型不会对OLS 估计带来任何问题。第二种类型则往往导致模型估计的有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量是克服偏误的有效途径。第三种类型的OLS 估计则既是有偏、也是非一致的,需要采用工具变量法来加以克服。 二、典型例题分析 1、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的 (2)通常的t 检验不再服从t 分布。 (3)OLS 估计量不再具有最佳线性无偏性。 答: 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS 估计量出现偏误。 2、已知模型 i i i i u X X Y +++=22110βββ 式中,i Y 为某公司在第i 个地区的销售额;i X 1为该地区的总收入;i X 2为该公司在该地区投入的广告费用(i=0,1,2……,50)。 (1)由于不同地区人口规模i P 可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项u i 是异方差的。假设i σ依赖于总体i P 的容量,请逐步描述你如何对此进行检验。需说明:1)零假

计量经济学(伍德里奇第五版中文版)答案

第1章 解决问题的办法 1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。 (二)呈负相关关系意味着,较大的一类大小是与较低的性能。因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。 (三)鉴于潜在的混杂因素- 其中一些是第(ii)上市- 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。 1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同? (二)公司很可能取决于工人的特点选择在职培训。一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。企业甚至可能歧视根据年龄,性别或种族。也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。 (iii)该金额的资金和技术工人也将影响输出。所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。管理者的素质也有效果。 (iv)无,除非训练量是随机分配。许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。 1.3没有任何意义,提出这个问题的因果关系。经济学家会认为学生选择的混合学习和工作(和其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有168小时。然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第2章开始。但我们不会声称一个变量“使”等。他们都选择学生的变量。 第2章 解决问题的办法

计量经济学案例分析汇总

计量经济学案例分析1 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为元, 最低的黑龙江省仅为人均元,最高的上海市达人均10464元,上海是黑龙江的倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表的数据: 表 2002年中国各地区城市居民人均年消费支出和可支配收入

第四章计量经济学答案范文

第四章一元线性回归 第一部分学习目的和要求 本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。回归方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。本章还介绍了如何应用线性模型来建立预测和控制。需要掌握和理解以下问题: 1 一元线性回归模型 2 最小二乘方法 3 一元线性回归的假设条件 4 方差分析方法 5 t检验方法 6 相关系数检验方法 7 参数的区间估计 8 应用线性回归方程控制与预测 9 线性回归方程的经济解释 第二部分练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 ξ,目的在于使模型更1 在经济计量模型中引入反映()因素影响的随机扰动项 t 符合()活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的()、社会环境与自然环境的()决定了经济变量本身的();(2)建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ()是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。()是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的()。某自变量回归系数β的意义,指

计量经济学-案例分析-第六章

第六章 案例分析 一、研究目的 2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农村居民消费模型也能用于农村居民消费水平的预测。 二、模型设定 正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为 t t t u X Y ++=21ββ (6.43) 式中,Y t 为农村居民人均消费支出,X t 为农村人均居民纯收入,u t 为随机误差项。表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。 表6.3 1985-2003年农村居民人均收入和消费 单位: 元

2000 2001 2002 2003 2253.40 2366.40 2475.60 2622.24 1670.00 1741.00 1834.00 1943.30 314.0 316.5 315.2 320.2 717.64 747.68 785.41 818.86 531.85 550.08 581.85 606.81 为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。 根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得 t t X Y 0.59987528.106?+= (6.44) Se = (12.2238) (0.0214) t = (8.7332) (28.3067) R 2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706 该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW 统计表可知,d L =1.18,d U = 1.40,模型中DW

《计量经济学》习题(第四章)

第四章 习 题 一、单选题 1、如果回归模型违背了同方差假定,最小二乘估计量____ A .无偏的,非有效的 B.有偏的,非有效的 C .无偏的,有效的 D.有偏的,有效的 2、Goldfeld-Quandt 方法用于检验____ A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 3、DW 检验方法用于检验____ A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 4、在异方差性情况下,常用的估计方法是____ A .一阶差分法 B.广义差分法 C .工具变量法 D.加权最小二乘法 5、在以下选项中,正确表达了序列自相关的是____ j i u x Cov D j i x x Cov C j i u u Cov B j i u u Cov A j i j i j i j i ≠≠≠≠≠=≠≠,0),(.,0),(.,0),(.,0),(. 6、如果回归模型违背了无自相关假定,最小二乘估计量____ A .无偏的,非有效的 B.有偏的,非有效的 C .无偏的,有效的 D.有偏的,有效的 7、在自相关情况下,常用的估计方法____ A .普通最小二乘法 B.广义差分法 C .工具变量法 D.加权最小二乘法 8、White 检验方法主要用于检验____ A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 9、Glejser 检验方法主要用于检验____ A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 10、简单相关系数矩阵方法主要用于检验____ A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 11、所谓异方差是指____ 22 22 )(.)(.)(.)(.σσσσ==≠≠i i i i x Var D u Var C x Var B u Var A

计量经济学第四章练习题及参考解答

第四章练习题及参考解答 假设在模型i i i i u X X Y +++=33221βββ中,32X X 与之间的相关系数为零,于是有人建议你进行如 下回归: i i i i i i u X Y u X Y 23311221++=++=γγαα (1)是否存在3 322????βγβα ==且?为什么? (2)1 11???βαγ会等于或或两者的某个线性组合吗? (3)是否有()()()()3 3 2 2 ?var ?var ?var ?var γβα β==且? 练习题参考解答: (1) 存在3 322????βγβα==且。 因为()()()() ()()() 2 3223223232322?∑∑∑∑∑∑∑--= i i i i i i i i i i i x x x x x x x y x x y β 当 32X X 与之间的相关系数为零时,离差形式的032=∑i i x x 有()()()()222223222322 ??αβ=== ∑∑∑∑∑∑i i i i i i i i x x y x x x x y 同理有:3 3??βγ= (2) 1 11???βαγ会等于或的某个线性组合 因为 12233???Y X X βββ=--,且122??Y X αα=-,133??Y X γγ=- 由于3322????βγβα ==且,则 112222 2 2 ?????Y Y X Y X X αααββ-=-=-= 则 11 122332 3112 3 ???????Y Y Y X X Y X X Y X X αγβββαγ--=--=--=+- (3) 存在()()()()3 3 2 2 ?var ?var ?var ?var γβα β==且。 因为()() ∑-= 223 2 22 2 1?var r x i σβ 当023=r 时,() ()()2222 2 23 222 2 ?var 1?var α σσβ== -=∑∑i i x r x 同理,有()()3 3 ?var ?var γβ= 在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔

计量经济学-案例分析-第八章

第八章案例分析 改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存 款也迅速增长。经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。为了考察改革开放以来中 国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表 居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。 表8.1为1978-2003年中国的国民总收入和城乡居民人民币储蓄存款年底余额及增加额的数据。 单位:亿元 2004 鉴数值,与用年底余额计算的数值有差异。 为了研究1978—2003年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城

乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示: 图8.5 从图8.5中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量 (YY ),并作时序图(见图 8.6) 从居民储蓄增量图可以看出,城乡居民的储蓄行为表现出了明显的阶段特征: 2000年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图 看(见图8.7),也呈现出了相同的阶段性特征。 为了分析居民储蓄行为在 1996年前后和2000年前后三个阶段的数量关系,引入虚拟变 量D 和D2°D 和D 2的选择,是以1996>2000年两个转折点作为依据,1996年的GNI 为66850.50 亿元,2000年的GNI 为国为民8254.00亿元,并设定了如下以加法和乘法两种方式同时引入 虚拟变量的的模型: YY = 1+ 2GNI t 3 GNI t 66850.50 D 1t + 4 GNh 88254.00 D 2t i D 1 t 1996年以后 D 1 t 2000年以后 其中: D 1t _ t 1996年及以前 2t 0 t 2000年及以前 对上式进行回归后,有: Dependent Variable: YY Method: Least Squares Date: 06/16/05 Time: 23:27 120000 8.7 1996年和 100000- 40000 2WM GNi o eOB2&ISEea9a9l2949698[Ma2 20CUC ir-“- 1CC0C 图 8.6 *OOCO mnoot , RtKXD Tconr GF*

计量经济学(第四版)习题及参考答案详细版

计量经济学(第四版)习题参考答案 潘省初

第一章 绪论 1.1 试列出计量经济分析的主要步骤。 一般说来,计量经济分析按照以下步骤进行: (1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项? 为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。 1.3什么是时间序列和横截面数据? 试举例说明二者的区别。 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。 横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4估计量和估计值有何区别? 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y 就是一个估计量,1 n i i Y Y n == ∑。现有一样本,共4个数,100,104,96,130,则 根据这个样本的数据运用均值估计量得出的均值估计值为 5.1074 130 96104100=+++。 第二章 计量经济分析的统计学基础 2.1 略,参考教材。

2.2请用例2.2中的数据求北京男生平均身高的99%置信区间 N S S x = =45 =1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684 也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH 备择假设 120:1≠μH 检验统计量 () 10/25X X μσ-Z == == 查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH 备择假设 : 2500:1≠μH ()100/1200.83?X X t μσ-= === 查表得 131.2)116(025.0=-t 因为t = 0.83 < 131.2=c t , 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。

计量经济学第二版第四章课后习题

第四章课后习题 4.1 解 1)存在22β?α?=且3 3β?γ?=。因为2X 和3X 之间的相关系数为零,即2X 和3X 相互之间不存在线性关系,两者是相互独立的,所以分别一元回归和二元回归两者的系数都不会发生变 化。 利用公式证明如下: 2)会。 3)如第一问解释,22β?α?=,3 3β?γ?=是成立的,所以存在)α?()β?(22V a r V a r =,)α?()β?(33 Var Var =。 4.2 解: 根据我对多重共线性的认识,我认为任何一种逐步回归都存在弊端。根据课本上对多重共线性的定义,不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关

系。而逐步回归法是通过逐步筛选并剔除引起多重共线性的变量。所以在采用逐步回归法时,难免会出现一些不符合要求的变量被剔除的情况,此变量岁引起多重共线性,但其对被解释变量也有一定的影响,直接剔除就是忽略其的影响,使得回归结果不够精确。误差增大。 4.3解:将数据输入到Eviews中,可得如下图所示: 图1 注释:X2表示国内生产总值GDP,X3表示居民消费价格指数CPI。 利用软件,采用最小二乘法进行回归,结果如下图所示:

图2 建立回归模型如下: i t X X Y μβββ+++33221ln ln ln = 1)从回归结果中,可知此模型的参数1β=﹣3.06015,2β=1.656675,3β=﹣1.057054 2) 利用软件求出lnx2和lnx3的相关系数,可得 由上图可知lnx2,lnx3之间存在很强的线性相关性。证实存在多重共线性。 根据题目要求分别进行三次回归:

计量经济学-案例分析-第二章

第二章案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

《计量经济学》第三版课后题答案

第一章绪论 参考重点: 计量经济学的一般建模过程 第一章课后题(1.4.5) 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 第二章经典单方程计量经济学模型:一元线性回归模型参考重点: 1.相关分析与回归分析的概念、联系以及区别? 2.总体随机项与样本随机项的区别与联系?

计量经济学第四章习题详解

第四章习题 4.1 没有进行t检验,并且调整的可决系数也没有写出来,也就是没有考虑自由度的影响,会使结果存在误差。 一研究的目的和要求 我们知道,商品进口额与很多因素有关,了解其变化对进出口产品有很大帮助。为了探究和预测商品进口额的变化,需要定量地分析影响商品进口额变化的主要因素。 二、模型的设定及其估计 经分析,商品进口额可能与国内生产总值、居民消费价格指数有关。为此,考虑国内生产总值GDP、居民消费价格指数CPI为主要因素。各影响变量与商品进口额呈正相关。为此,设定如下形式的计量经济模型: =+ln+lnCP

式中,为第年中国商品进口额(亿元);lnGDP为第年国内生产总值(亿元);lnCPI为居民消费价格指数(以1985年为100)。各解释变量前的回归系数预期都大于零。 为估计模型,根据上表的数据,利用EViews软件,生成Y、lnGDP、lnCPI等数据,采用OLS方法估计模型参数,得到的回归结果如下图所示: 模型方程为: lnY=-3.111486+1.338533lnGDP-0.421791lnCPI (0.463010) (0.088610) (0.233295) t= (-6.720126) (15.10582) (-1.807975) =0.988051 =0.987055 F=992.2582 该模型=0.988051,=0.987055,可决系数很高,F检验值为992.2582,明显显著。但是当=0.05时,(n-k)=(27-3)=2.064,不仅lnCPI的系数不显著,而且,lnCPI的符号与预期相反,这表明可能存在 严重的多重共线性。 计算各解释变量的相关系数,选择lnGDP,lnCPI数据,“view/correlation”得相关系数矩阵。 1 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在一定的多重共线性。 为了进一步了解多重共线性的性质,我们做辅助回归,即每个解释变量分别作为被解释变量都对剩余的解释变量进行回归。

计量经济学案例分析一元回归模型实例分析报告

∑ x = 1264471.423 ∑ y = 516634.011 ∑ X = 52432495.137 ∑ ? ? ? ? 案例分析 1— 一元回归模型实例分析 依据 1996-2005 年《中国统计年鉴》提供的资料,经过整理,获得以下农村居民人均 消费支出和人均纯收入的数据如表 2-5: 表 2-5 农村居民 1995-2004 人均消费支出和人均纯收入数据资料 单位:元 年度 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 人均纯 收入 1577.7 1926.1 2090.1 2161.1 2210.3 2253.4 2366.4 2475.6 2622.2 2936.4 人均消 费支出 1310.4 1572.1 1617.2 1590.3 1577.4 1670.1 1741.1 1834.3 1943.3 2184.7 一、建立模型 以农村居民人均纯收入为解释变量 X ,农村居民人均消费支出为被解释变量 Y ,分析 Y 随 X 的变化而变化的因果关系。考察样本数据的分布并结合有关经济理论,建立一元线 性回归模型如下: Y i =β0+β1X i +μi 根据表 2-5 编制计算各参数的基础数据计算表。 求得: X = 2262.035 Y = 1704.082 2 i 2 i ∑ x i y i = 788859.986 2 i 根据以上基础数据求得: β1 = ∑ x i y 2 i i = 788859.986 126447.423 = 0.623865 β 0 = Y - β1 X = 1704.082 - 0.623865 ? 2262.035 = 292.8775 样本回归函数为: Y i = 292.8775 + 0.623865X i 上式表明,中国农村居民家庭人均可支配收入若是增加 100 元,居民们将会拿出其中 的 62.39 元用于消费。

相关主题