搜档网
当前位置:搜档网 › 计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析
计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

第二章经典单方程计量经济学模型:一元线性回归模型

一、内容提要

本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析

例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为

β+

μ

β

kids

=educ

+

1

(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答:

(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。

例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释α和β。

(2)OLS 估计量α

?和β?满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 解答:

(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值。

(2)OLS 估计量α

?和仍β?满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设。

(3)如果t μ的分布未知,则所有的假设检验都是无效的。因为t 检验与F 检验是建立在μ的正态分布假设之上的。

例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:

首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则

μβα++=?=N E E 100*

由此有如下新模型

)100/()100/()100/(*μβα++=N E

或 ****μβα++=N E

这里100/*αα=,100/*ββ=。所以新的回归系数将为原始模型回归系数的1/100。 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N ,于是

μβαμβα++=++=)12/*(N N E

或 μβα++=*)12/(N E

可见,估计的截距项不变,而斜率项将为原回归系数的1/12。

例4、对没有截距项的一元回归模型

i i i X Y μβ+=1

称之为过原点回归(regrission through the origin )。试证明

(1)如果通过相应的样本回归模型可得到通常的的正规方程组

∑∑==0

0i

i

i X e e

则可以得到1β的两个不同的估计值:

X Y =1~β, ()()∑∑=2

1

?i

i i X Y X β。

(2)在基本假设0)(i =μE 下,1~

β与1

?β均为无偏估计量。 (3)拟合线X Y 1??β=通常不会经过均值点),(Y X ,但拟合线X Y 1~~β=则相反。 (4)只有1

?β是1β的OLS 估计量。 解答:

(1)由第一个正规方程

0=∑t

e

0)~(1=-∑t t X Y β 或 ∑∑=t t X Y 1~β

求解得

X Y /~

1=β

由第2个下规方程

0)?(1=-∑t

t t

X Y X

β得

∑∑=21?t t

t

X Y

X β

求解得 )/()(?2

1

∑∑=t

t

t X

Y X β

(2)对于X Y /~

1=β,求期望

1

1111)](){[1

)]

(1[1)()~

(ββμβμββ==+=+==X

X

E n X E X X n

E X X Y E E t t t t

这里用到了t X 的非随机性。

对于)/()(?2

1

∑∑=t

t

t X

Y X β,求期望

)/()?(21

∑∑=t t t X Y X E E β

12212122)()1()()1(

)]([)1

()()1(βμβμβ=+=+==∑∑∑∑∑∑∑∑t t t

t t t t t t t t t E X X X X X X E X Y X E X

(3)要想拟合值X Y 1??β=通过点),(Y X ,X 1

?β必须等于Y 。但X X

Y

X X t

t

t ∑∑=21?β,

通常不等于Y 。这就意味着点),(Y X 不太可能位于直线X Y 1

??β=上。 相反地,由于Y X =1~β,所以直线X Y 1

~

?β=经过点),(Y X 。 (4)OLS 方法要求残差平方和最小

Min ∑∑-==

212

)?(t

t t

X Y e

RSS β 关于1

?β求偏导得

0))(?(2?11

=--=??∑t

t t X X Y RSS ββ

0)?(1=-∑t

t t

X Y X

β ()()∑∑=2

1

?i

i i X Y X β

可见1

?β是OLS 估计量。 例5.假设模型为t t t X Y μβα++=。给定n 个观察值),(11Y X ,),(22Y X ,…,

),(n n Y X ,按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来

并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜

率;最后对这些斜率取平均值,称之为β

?,即β的估计值。 (1)画出散点图,给出β

?的几何表示并推出代数表达式。 (2)计算β

?的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解释理由。

(3)证明为什么该估计值不如我们以前用OLS 方法所获得的估计值,并做具体解释。 解答:

(1)散点图如下图所示。

(X n ,Y n )

首先计算每条直线的斜率并求平均斜率。连接),(11Y X 和),(t t Y X 的直线斜率为

)/()(11X X Y Y t t --。由于共有n -1条这样的直线,因此

][

11?21

1

∑==---=n t t t t X X Y Y n β (2)因为X 非随机且0)(=t E μ,因此

βμμβμβαμβα=--+=-++-++=--][])()([][

1

1

11111X X E X X X X E X X Y Y E t t t t t t t

这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的。

(3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最付佳线性无偏估计量,因此,

这里得到的β

?的有效性不如β的OLS 估计量,所以较差。

例6.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:

)

011.0()105.151(067.0105.384?t

t Y S +=

2R

=0.538 023.199?=σ

(1)β的经济解释是什么?

(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?

(3)对于拟合优度你有什么看法吗?

(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?

解答:

(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正。实际的回归式中,β的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。

(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。

(4)检验单个参数采用t 检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。由t 分布表知,双侧1%下的临界值位于2.750与 2.704之间。斜率项计算的t 值为0.067/0.011=6.09,截距项计算的t 值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。

三、习题

(一)基本知识类题型2-1.解释下列概念:

1)总体回归函数

2)样本回归函数

3)随机的总体回归函数

4)线性回归模型

5)随机误差项(u i)和残差项(e i)

6)条件期望

7)非条件期望

8)回归系数或回归参数

9)回归系数的估计量

10)最小平方法11)最大似然法

12)估计量的标准差

13)总离差平方和

14)回归平方和

15)残差平方和

16)协方差

17)拟合优度检验

18)t检验

19)F检验

2-2.判断正误并说明理由:

1)随机误差项u i和残差项e i是一回事

2)总体回归函数给出了对应于每一个自变量的因变量的值

3)线性回归模型意味着变量是线性的

4)在线性回归模型中,解释变量是原因,被解释变量是结果

5)随机变量的条件均值与非条件均值是一回事

2-3.回答下列问题:

1)线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计?

2)总体方差与参数估计误差的区别与联系。

3)随机误差项u i和残差项e i的区别与联系。

4)根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的

拟合优度问题?

5)为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准?

6)R2检验与F检验的区别与联系。

7)回归分析与相关分析的区别与联系。

8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9) 为什么要进行解释变量的显著性检验?

10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?

2-2.下列方程哪些是正确的?哪些是错误的?为什么?

⑴ y x t n t t

=+=αβ12,,, ⑵ y x t n t t t

=++=αβμ12,,, ⑶ y x t n t t t =++= ,,,αβμ12 ⑷ ,,,y x t n t t t =++=αβμ12 ⑸ y x t n t t =+= ,,,αβ12 ⑹ ,,,y x t n t t =+=αβ12

⑺ y x t n t t t =++= ,,,αβμ12 ⑻ ,,,y x t n t t

t =++=αβμ12

其中带“^”者表示“估计值”。

2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。

(二)基本证明与问答类题型

2-4.对于一元线性回归模型,试证明: (1)i i x y E βα+=)( (2)2

)(σ=i y D

(3)0),(=j i y y Cov j i ≠

2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性和有效性?

2-6.对于过原点回归模型i i i u X Y +=1β ,试证明

∑=

2

2

1)(i u X Var σβ

2-7. 试证明: (1)0=∑i

e

,从而:0=e (2)0=∑i i x

e

(3)

0=∧∑i

i

Y

e ;即残差i e 与i Y 的估计值之积的和为零。

2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证

明:σ2

的ML 估计量为∑=∧=n i i n 1

2

~

2

1σσ ,并且是有偏的。

2-9.熟悉t 统计量的计算方法和查表判断。

2-10.证明:2

2

)(yx r R = ;其中R 2是一元线性回归模型的判定系数,yx r 是y 与x 的相关

系数。

2-11. 试根据置信区间的概念解释t 检验的概率意义,即证明:对于显著性水平α,当

2

αt t i >时,b i 的100(1-α)%的置信区间不包含0。

2-12.线性回归模型

y x t n t t t

=++=αβμ12,,,

的0均值假设是否可以表示为

1

01

n

t

t n

μ

=∑=?为什么?

2-13.现代投资分析的特征线涉及如下回归方程:t m t t u r r ++=10ββ;其中:r 表示股票或债券的收益率;r m 表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t 表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据1956~1976年间240个月的数据,Fogler 和Ganpathy 得到IBM 股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

mt t r r 0598.17264.0+=∧

4710.02=r

(0.3001) (0.0728)

要求:(1)解释回归参数的意义;(2)如何解释r 2?(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t 检验进行检验(α=5%)。 2-14. 已知模型i i i u x Y ++=βα,证明:估计量α可以表示为:i

i

n

i y W x n )1

(1

-=

∑=∧

α 这

里∑?

?

=

2

i

i

i x x W

2-15.已知两个量X 和Y 的一组观察值(x i ,y i ),i=1,2,…,n 。 证明:Y 的真实值和拟合值有共同的均值。

2-16.一个消费分析者论证了消费函数i i bY a C +=是无用的,因为散点图上的点(i C ,i Y )不在直线i i bY a C +=上。他还注意到,有时Y i 上升但C i 下降。因此他下结论:C i 不是Y i 的函数。请你评价他的论据(这里C i 是消费,Y i 是收入)。

2-17.证明:仅当R 2=1时,y 对x 的线性回归的斜率估计量等于x 对y 的线性回归的斜率估计量的倒数。

2-18.证明:相关系数的另一个表达式是:y

x S S r ∧

=β 其中∧β为一元线性回归模型一次项

系数的估计值,S x 、S y 分别为样本标准差。

2-19.对于经济计量模型:i i i u X b b Y ++=10 ,其OLS 估计参数1b 的特性在下列情况下会受到什么影响:(1)观测值数目n 增加;(2)Xi 各观测值差额增加;(3)Xi 各观测值近似相等;(4)E (u 2)=0 。

2-20.假定有如下的回归结果:t t X Y 4795.06911.2-=∧

,其中,Y 表示美国的咖啡的消费量(每天每人消费的杯数),X 表示咖啡的零售价格(美元/杯),t 表示时间。 要求:

(1)这是一个时间序列回归还是横截面序列回归?做出回归线; (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?

(4)根据需求的价格弹性定义:弹性=斜率×(X/Y ),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? (三)基本计算类题型

2-21.下面数据是对X 和Y 的观察值得到的。 ∑Y i =1110; ∑X i =1680; ∑X i Y i =204200 ∑X i 2=315400; ∑Y i 2=133300

假定满足所有的古典线性回归模型的假设,要求:(1)b 1和b 2?(2)b 1和b 2的标准差?(3)r 2?(4)对B 1、B 2分别建立95%的置信区间?利用置信区间法,你可以接受零假设:B 2=0吗?

2-22.假设王先生估计消费函数(用模型i i i u bY a C ++=表示),并获得下列结果:

i i Y C 81.015+=∧

,n=19

(3.1) (18.7) R 2=0.98 这里括号里的数字表示相应参数的T 比率值。

要求:(1)利用T 比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方差;(3)构造b 的95%的置信区间,这个区间包括0吗?

2-23.下表给出了每周家庭的消费支出Y (美元)与每周的家庭的收入X (美元)的数据。

要求:

(1)对每一收入水平,计算平均的消费支出,E (Y ︱X i ),即条件期望值; (2)以收入为横轴、消费支出为纵轴作散点图; (3)在散点图中,做出(1)中的条件均值点;

(4)你认为X 与Y 之间、X 与Y 的均值之间的关系如何?

(5)写出其总体回归函数及样本回归函数;总体回归函数是线性的还是非线性的?

2-24.根据上题中给出的数据,对每一个X 值,随机抽取一个Y 值,结果如下:

要求:

(1)以Y 为纵轴、X 为横轴作图,并说明Y 与X 之间是怎样的关系? (2)求样本回归函数,并按要求写出计算步骤;

(3)在同一个图中,做出样本回归函数及从上题中得到的总体回归函数;比较二者相同吗?为什么?

2-25.下表给出了1990~1996年间的CPI 指数与S&P500指数。

资料来源:总统经济报告,1997,CPI 指数见表B-60,第380页;S&P 指数见表B-93,第406页。

要求:(1)以CPI 指数为横轴、S&P 指数为纵轴做图;

(2)你认为CPI 指数与S&P 指数之间关系如何?

(3)考虑下面的回归模型:t t t u CPI B B P S ++=21)&(,根据表中的数据运用OLS 估计上述方程,并解释你的结果;你的结果有经济意义吗?

2-26.下表给出了美国30所知名学校的MBA 学生1994年基本年薪(ASP )、GPA 分数(从1~4共四个等级)、GMA T 分数以及每年学费的数据。

学校

ASP/美元 GPA GMAT 学费/美元 Harvard 102630 3.4 650 23894 Stanford 100800 3.3 665 21189 Columbian 100480 3.3 640 21400 Dartmouth 95410 3.4 660 21225 Wharton 89930 3.4 650 21050 Northwestern 84640 3.3 640 20634 Chicago 83210 3.3 650 21656 MIT 80500 3.5 650 21690 Virginia 74280 3.2 643 17839 UCLA 74010

3.5

640

14496

Berkeley 71970 3.2 647 14361

Cornell 71970 3.2 630 20400

NUY 70660 3.2 630 20276

Duke 70490 3.3 623 21910

Carnegie Mellon 59890 3.2 635 20600

North Carolina 69880 3.2 621 10132

Michigan 67820 3.2 630 20960

Texas 61890 3.3 625 8580

Indiana 58520 3.2 615 14036

Purdue 54720 3.2 581 9556

Case Western 57200 3.1 591 17600

Georgetown 69830 3.2 619 19584

Michigan State 41820 3.2 590 16057

Penn State 49120 3.2 580 11400

Southern Methodist 60910 3.1 600 18034

Tulane 44080 3.1 600 19550

Illinois 47130 3.2 616 12628

Lowa 41620 3.2 590 9361

Minnesota 48250 3.2 600 12618

Washington 44140 3.3 617 11436

要求:(1)用双变量回归模型分析GPA是否对ASP有影响?

(2)用合适的回归模型分析GMA T分数是否与ASP有关?

(3)每年的学费与ASP有关吗?你是如何知道的?如果两变量之间正相关,是否意味着进到最高费用的商业学校是有利的;

(4)你同意高学费的商业学校意味着高质量的MBA成绩吗?为什么?

2-27.从某工业部门抽取10个生产单位进行调查,得到下表所列的数据:

要求:假定年产量与工作人员数之间存在线性关系,试用经典回归估计该工业部门的生产函

数及边际劳动生产率。

2-28.下表给出了1988年9个工业国的名义利率(Y )与通货膨胀率(X )的数据:

国家

Y (%) X (%) 澳大利亚 11.9 7.7 加拿大 9.4 4.0 法国 7.5 3.1 德国 4.0 1.6 意大利 11.3 4.8 墨西哥 66.3 51.0 瑞典 2.2 2.0 英国 10.3 6.8 美国

7.6

4.4

资料来源:原始数据来自国际货币基金组织出版的《国际金融统计》

要求:

(1)以利率为纵轴、通货膨胀率为横轴做图; (2)用OSL 进行回归分析,写出求解步骤;

(3)如果实际利率不变,则名义利率与通货膨胀率的关系如何? (四)自我综合练习类题型

2-29.综合练习:自己选择研究对象,收集样本数据(利用我国公开发表的统计资料),应用计量经济学软件(建议使用Eviews3.1)完成建立计量经济学模型的全过程,并写出详细的研究报告。(通过练习,能够熟练应用计量经济学软件Eviews3.1中的最小二乘法)

四、习题参考答案

2-1.答:

⑴总体回归函数是指在给定i X 下的Y 的分布的总体均值与i X 有函数关系。 ⑵样本回归函数指对应于某个给定的X 的Y 值的一个样本而建立的回归函数。 ⑶ 随机的总体回归函数指含有随机误差项的总体回归函数,形如:

i i i u X Y ++=21ββ

⑷线性回归模型指对参数β为线性的回归,即β只以它的1次方出现,对X 可以是或不是线性的。

⑸随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。

⑹残差项是一随机变量,针对样本回归函数而言。

⑺条件期望又称条件均值,指X 取特定i X 值时的Y 的期望值。 ⑼回归系数(或回归参数)指1β、2β等未知但却是固定的参数。

⑽回归系数的估计量指用∧1β、∧

2β等表示的用已知样本所提供的信息去估计出来的量。 ⒀估计量的标准差指度量一个变量变化大小的标准。

⒁总离差平方和用TSS 表示,用以度量被解释变量的总变动。

⒂回归平方和用ESS 表示,用以度量由解释变量变化引起的被解释变量的变化。 ⒃残差平方和用RSS 表示,用以度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的。

⒄协方差用Cov (X ,Y )表示,是用来度量X 、Y 二个变量同时变化的统计量。

2-2.答:错;错;错;错;错。(理由见本章其他习题答案) 2-3.答:

⑴线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。

⑸判定系数TSS

RSS

TSS ESS R -==

12

,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣。该值越大说明拟合得越好。

⑽不是。 2-8.证明:

由于 ∑∑=21

?t

t

t X

Y

X β,因此

)()()()?(12

2

22

1

t t t t t t t t

t t X Var X X Y X X

Var X

Y X Var Var μββ+???

?

??===∑∑∑∑ ∑∑∑∑∑===2

2

2222

222)()()(t

t t t t t X X X Var X X μμσσμ 2-9.证明:

⑴根据定义得知,

)

()()(21212121X Y n X n n Y n X n Y X Y Y Y

e i

i i i i i

i

ββββββββ--=--=--=--=-=∑∑∑∑∑∧

X Y 21ββ+=

0=∴∑i e

从而使得:0==

∑n

e e i

证毕。 ⑵

[]0

)1()(()()()??())(?(=∴=-=-=-++--=-+---=+--=--=∑∑∑∑∑∑∑∑i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i X e n X e X e X e X e Y X X e X Y Y X X Y e Y X X e Y Y X X Y Y X Y X Y X X Y X X Y

Y X e

证毕。 ⑶

)(?2

1

212

1

=+=+=+=∑∑∑∑∑∑i

i

i

i i i i

i

i e

X n e X e e X e Y e βββββ

β

证毕。

2-14.答:线性回归模型:t t t x y μβα++=中的0均值假设0)E(2=u 不可以表示为:

101

n

t

t n

μ

=∑=,因为前者表示取完所的可能的样本组合后的平均状态,而后者只是一个样本的

平均值。 2-16.证明:

∑∑∑

===-=-=n

i i

n

i i

i n

i i

x

y x

x n

y x y 1

211

?? βα

∑∑∑∑∑======-=-=n

i i i n i i n i n i i i i i n i i i y x x y y x y y x y x

1

1

1

1

1

)( i n

i i

n i n

i i i n

i i

n

i i

y x

x n

y x x

x n

y )1

(?12

11121

∑∑∑∑∑=====-=-= α

证毕。

2-17.证明:

βα??和 满足正规方程[]

0)??(1

=+-∑=n

i i

i x y βα i

i x y βα???+= 0)?(1=-∴∑=i n

i i y

y 即表明Y 的真实值与拟合值有共同的均值。 证毕。

2-18.答:他的论据是错误的。原因是他忽略了随机误差项i u ,这个随机误差项可取正值和负值,但是0)E(=i u ,将i C 与i Y 的关系表达为i i Y C βα+=是不准确的,而是一个平均关系。 2-19.证明:

设:,???10i i x y

αα+= ,???10i

i y x ββ+= 由于:∑∑∑∑∑∑=?==2

22

2222

)((1)(i i i i i i i i y

y x x y x y x R 线性回归的斜率估计量:1

221?1

/)(1?βα

==

=

∑∑∑∑i i i i

i

i y y x x

y x 证毕。 2-20.证明:

∑∑=

2

x

y x

β 又∵ 1

2

-=

∑n x

S x , 1

2

-=

∑?

n y

S y

∴r y x

y x n y

n x

x y x

S S

y

x ==

--?=

∑∑∑∑∑∧

2

2

2

2

2

1

1 β

证毕。 2-22.解:

⑴这是一个横截面序列回归。(图略)

⑵截距2.6911表示咖啡零售价在t 时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t 时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯; ⑶不能;

⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X 值及与之对应的Y 值。 2-23.解:

⑴168==

∑n

X X i

,111==

∑n

Y Y

i

17720

1111681011101681111680204200)())((=??+?-?-=+--=--∴∑∑Y X X Y X Y Y X Y Y X X i i i i i i 33160

1681681031540010102)2()(222222=??-=+?-=+-=-∑∑∑X X X X X X X X X i i i i 又

22.211685344.011121=?-=-=X Y ββ

⑵8

)??2(2

10)?(2

?22

22

2

∑∑∑+-=

--=

-=

i i i i

i i

i

Y Y Y Y Y

Y n e σ

5344.03316017720)())((2

2

==---=∴∑

∑X X Y Y X X i

i i

β

i

i X Y 5344.022.21?+= 81

.62016805344.022.2123154005344.05344.022.2122.21102042005344.02111022.212133300)25344.0222.212()??2(2122221222=???+??+??+??-??-=+++?-?-=+-∴∑∑i i i i i i i i i i X X Y X Y Y Y Y

Y Y ββββ60.778

81.620?2==∴σ

81.7333160

10315400

60.77)

()(2

2

21

=??=

-=

∴∑∑X X n X Var i

i

σβ,5913.881.73)(1==βse

0023.033160

60

.77)(22

2==

=

∑i

x

Var σβ,0484.00023.0)(2==βse

⑶∑∑--

=2

22

)(1Y Y e

r i i

10090123210133300)(,

81.6202

2=-=-=∑∑Y Y e i i 又

9385.010090

81

.62012=-

=∴r

⑷%95)306.2(=≤t p ,自由度为8

306.25913

.822.21306.21

≤-≤

-∴β,解得:110315.414085.1ββ为≤≤的95%的置信区间。

同理,306.20484.05344.0306.22

≤-≤

-∴β,解得:646.04227.02≤≤β为2β的95%的置信区间。

由于02=β不在2β的置信区间内,故拒绝零假设:02=β。 2-24.解:

⑴由于参数估计量β的T 比率值的绝对值为18.7且明显大于2,故拒绝零假设

0:0=βH ,从而β在统计上是显著的;

⑵参数α的估计量的标准方差为15/3.1=4.84,参数β的估计量的标准方差为0.81/18.7=0.043;

⑶由⑵的结果,β的95%的置信区间为:

043.0)2(81.0(975.0--n t ,091.081.0()043.0)2(81.0975.0-=-+n t ,)091

.081.0+,显然这个区间不包括0。 2-25.解:

⑴65)80(==i X Y E 77)100(==i X Y E

89)120(==i X Y E 101)140(==i X Y E 113)160(==i X Y E 125)180(==i X Y E 137)200(==i X Y E 149)220(==i X Y E 161)240(==i X Y E 173)260(==i X Y E

第三章、经典单方程计量经济学模型:多元线性回归模型

一、内容提要

本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。

本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F 检验,并讨论了F 检验与拟合优度检验的内在联系。

本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F 检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检

一元线性回归模型习题和答案解析

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。A A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。D A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。A A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。C A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。B A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。B A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。D A ()()()i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β∑∑ = D i i i i 1 2 x n X Y -X Y ?βσ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以?σ表示估计标准误差,r 表示相关系数,则有__________。D A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。D

基于多元线性回归模型的影响居民消费水平相关因素分析

计量分析软件课程论文 论文题目:基于多元线性回归模型的影响居民消费 水平相关因素分析 姓名:学号: 学院:专业: 联系电话: 年月日 基于多元线性回归模型的影响居民消费 水平相关因素分析 一、研究背景 中国GDP总量超越日本,成为仅次于美国的第二大经济体,但我国人均GDP 依然很低,全球排名87位,这很大程度上制约了居民消费水平的提高。到2020年实现全面建成小康社会的目标,十八大明确提出提高居民人均收入和人均消费水平,共享改革开放成果。我国居民消费水平在改革开放后有了很大提高,但消费水平依然很低,消费量占GDP比重依然很小。为此,本文旨在根据全国经济宏观政策、国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等因素的变化情况,来分析如何提高居民消费水平,以判断是否能使居民消费水平有很大的提高。本文通过对1978-2010年影响居民消费水平因素数据的分析,找到影响居民消费水平的主要原因,通过计量经济分析方法来建立合理的模型,探讨影响居民消费增长的长期趋势规律,并给政府提出合理的建议,以提高居民消费水平。 二、影响居民消费水平的因素 宏观经济模型) + GDP- + + =,经济发展应该紧紧抓住消费这一 I (M C X G 驾马车,而居民消费水平的高低受制于多种因素。凯恩斯消费理论认为居民消费主要受收入影响,我国居民消费一直很低,消费意愿不强,本文通过计量分析找

到影响我国居民消费水平的主要因素,从根本上改善消费不足,促进我国经济的持续稳定健康发展。 消费分为居民消费和,居民消费包括农村居民消费和城镇居民消费。本文结合居民消费水平的影响因素,列出了国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等相关因素,进行计量分析,得到回归模型。 三、居民消费水平模型的总体分析框架 (1)多元线性回归法OLS 概述[1] 回归分析是计量经济分析中使用最多的方法,在现实问题研究中,因变量往往受制于多个经济变量的影响,通过统计资料,根据多个解释变量的最优组合来建立回归方程预测被解释变量的回归分析称为多元线性回归法。其模型基本形式为: 其中0β、1β、2β、3β…k β是1+k 个未知参数,称为多元回归系数。Y 称为被解释变量,t X 1、t X 2、t X 3…kt X 是k 个可以精确测量和可控的一般解释变量, t μ是随机误差项。当2≥k 时,上式为多元线性回归模型。 (2)多元回归模型的建立 定义被解释变量和解释变量,被解释变量为居民消费水平(Y 元),解释变量为国内生产总值(1X 亿元)、职工平均工资指数(2X )、城镇居民消费价格指数(3X )、普通中学及高等学校在校生数(4X 万人)、卫生机构数(5X 个)和基本设施铁路公路货运量(6X 万吨)。 (3)统计数据选取 本文所有数据均来自中国统计局和中国统计局外网中国统计年鉴。[2] 1978 184 21261 169732 195301 1979 208 175142 382929 1980 238 180553 493327 1981 264 190126 471336 1982 288 193438 492737 1983 316 196017 520197

一元线性回归模型练习题(无计算)

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类( )。 A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、进行相关分析时的两个变量( )。 A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 3、参数β的估计量β? 具备有效性是指( ) A Var(β?)=0 B Var(β?)为最小 C (β?-β)=0 D (β? -β)为最小 4、产量(X ,台)与单位产品成本(Y , 元/台)之间的回归方程为?i =356-1.5X i ,这说明( ) A 产量每增加一台,单位产品成本增加356元 B 产量每增加一台,单位产品成本减少1.5元 C 产量每增加一台,单位产品成本平均增加356元 D 产量每增加一台,单位产品成本平均减少1.5元 5、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示估计值,则( )。 A i i ??0Y Y 0σ∑=时,(-)= B 2i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2i i ??0Y Y σ∑=时,(-)为最小 6、对于i 01i i ??Y =X +e ββ+,以?σ表示估计标准误差,r 表示相关系数,则有( )。 A ?0r=1σ =时, B ?0r=-1σ=时, C ?0r=0σ=时, D ?0r=1r=-1σ=时,或 7、设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( )。 ??A Y Y B Y Y ??C Y Y D Y Y = = = = ??A Y Y B Y Y ?? C Y Y D Y Y = = = = 8、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( )。 ?A X Y B X Y ?C X Y D X Y (,) (,) (,) (,) ?A X Y B X Y ? C X Y D X Y (,) (,) (,) (,) 9、对回归模型t t t x y εββ++=10进行统计检验时,通常假定t ε服从( ) A N (0,2i σ) B t(n-2) C N (0,2σ) D t(n) 10、以y 表示实际观测值,y ?表示回归估计值,则普通最小二乘法估计参数的准则是使( ) A )?(i i y y -∑=0 B 2)?(i i y y -∑ =0 C )?(i i y y -∑ 为最小 D 2)?(i i y y -∑ 为最小

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

多元线性回归模型原理

研究在线性关系相关性条件下,两个或者两个以上自变量对一个因变量,为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上为复杂需借助计算机来完成。 计算公式如下: 设随机y与一般变量X1,X2,L X k的线性回归模型为: 其中°, 1,L k是k 1个未知参数,°称为回归常数,「L k称为回归系数;y称为被解释变量;x1, X2,L x k是k个可以精确可控制的一般变量,称为解释变量。 当P 1时,上式即为一元线性回归模型,k 2时,上式就叫做多元形多元回归模型。是随机误差,与一元线性回归一样,通常假设 同样,多元线性总体回归方程为y °1x1 2x2 L k x k 系数1表示在其他自变量不变的情况下,自变量乂[变动到一个单位时引起的因变量y 的平均单位。其他回归系数的含义相似,从集合意义上来说,多元回归是多维空间上的一个平面。 多元线性样本回归方程为:? ?° ?1x1 ?2x2 L ?k x k 多元线性回归方程中回归系数的估计同样可以采用最小二乘法。由残差平方和:SSE (y ?) 0 根据微积分中求极小值得原理,可知残差平方和SSE存在极小值。欲使SSE达到 最小,SSE对 °, 1丄k的偏导数必须为零。 将SSE对 ° ,1丄k求偏导数,并令其等于零,加以整理后可得到k 1各方程 SSE 式:—— 2 (y ?) ° i 通过求解这一方程组便可分别得到°, 1,L k的估计值,彳,?…?k回归 系数的估计值,当自变量个数较多时,计算十分复杂,必须依靠计算机独立完成。现在,利用SPSS,只要将数据输入,并指定因变量和相应的自变量,立刻就能得到结果。 对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显着性。

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

多元线性回归模型公式

二、多元线性回归模型 在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立 假设某一因变量y 受k 个自变量k x x x ,...,,21的影响,其n 组观测值为(ka a a a x x x y ,...,,,21),n a ,...,2,1=。那么,多元线性回归模型的结构形式为: a ka k a a a x x x y εββββ+++++=...22110(3、2、11) 式中: k βββ,...,1,0为待定参数; a ε为随机变量。 如果k b b b ,...,,10分别为k ββββ...,,,210的拟合值,则回归方程为 ?=k k x b x b x b b ++++...22110(3、2、12) 式中: 0b 为常数; k b b b ,...,,21称为偏回归系数。 偏回归系数i b (k i ,...,2,1=)的意义就是,当其她自变量j x (i j ≠)都固定时,自变量i x 每变化一个单位而使因变量y 平均改变的数值。 根据最小二乘法原理,i β(k i ,...,2,1,0=)的估计值i b (k i ,...,2,1,0=)应该使 ()[]min (2) 1 2211012 →++++-=??? ??-=∑∑==∧ n a ka k a a a n a a a x b x b x b b y y y Q (3、2、13) 有求极值的必要条件得 ???????==??? ??--=??=??? ??--=??∑∑=∧=∧n a ja a a j n a a a k j x y y b Q y y b Q 110) ,...,2,1(0202(3、2、14) 将方程组(3、2、14)式展开整理后得:

回归大作业-基于多元线性回归的期权价格预测模型

基于多元线性回归的期权价格预测模型 王某某 (北京航空航天大学计算机学院北京100191)1 摘要:期权是国际市场成熟、普遍的金融衍生品,是金融市场极为重要的金融工具。2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权——上证50ETF期权,翻开了境内场内期权市场的新篇章。50ETF期权上市以来,市场规模逐步扩大,其发展情况境外期权产品相同时期。本文以此为研究背景,以“50ETF购12月1.95”这支期权为研究对象,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。本次研究以多元线性回归的全模型(模型1)为出发点,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。进而通过主成分回归(模型4)和逐步回归(模型5)进行降维,结果表明因变量与解释变量之间存在强烈的线性相关关系,且主成分回归和逐步回归相比全模型有更好的预测能力。 关键词:期权价格多元线性回归50ETF 多重共线性因子分析 一、引言 期权(option)是依据合约形态划分的一种衍生品,指赋予其购买方在规定期限内按买卖双方约定的价格(即协议价格或行权价格)购买或者出售一定数量某种金融资产(即标的资产)的权利的合约。期权购买方为了获得这个权利,必须支付给期权出售方一定的费用,称为权利金或期权价格[1]。 2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权——上证50ETF,翻开了境内场内期权市场的新篇章。期权是与期货并列的基础衍生产品,是金融市场极为重要的金融工具之一。 自50ETF上市以来,市场规模逐步扩大。2015年2月日均合约成交面值为5.45亿元,12月就达到了47.69亿元,增长了7.75倍;2月日均合约成交量为2.33万张,12月就达到了19.81万张,增长了7.5倍;2月权利金总成交额为2.48亿元,12月就达到了35.98亿元,增长了13.51倍[1]。 我国股票市场有上亿的个人投资者,是一个较为典型的散户市场[1]。相较于专业投资机构讲,散户缺乏时间,精力以及专业分析,投资具有很大的投机行为。对于这些投资者来说,期权价格的变动则是他们最为关注的问题,其变化直接影响到自身的收益。在实际情况中,影响股票价格的因素很多,涉及到金融政策、利率政策以及国际市场等因素,其作用机制也相当复杂[2]。因此,对于期权价格预测的研究,则可以降低投资者的投资风险,及时调整投资结构,从而保障自身的收益。 1作者简介:王某某,北京航空航天大学研究生邮箱:bnuwjx@https://www.sodocs.net/doc/242193260.html,。

第三章多元线性回归模型(stata)

一、邹式检验(突变点检验、稳定性检验) 1.突变点检验 1985—2002年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表。 表 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据 年份 t y (万辆) t x (元) 年份 t y (万辆) t x (元) 1985 1994 1986 1995 4283 1987 1996 1988 1997 1989 1998 1990 1999 5854 1991 2000 6280 1992 2001 1993 2002 下图是关于t y 和t x 的散点图:

从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。 :两个字样本(1985—1995年,1996—2002年)相对应的模型回归参数相等H H :备择假设是两个子样本对应的回归参数不等。 1 在1985—2002年样本范围内做回归。

在回归结果中作如下步骤(邹氏检验): 1、 Chow 模型稳定性检验(lrtest) 用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All * 用似然比检验检验结构没有发生变化的约束 得到结果如下;

(如何解释) 2.稳定性检验(邹氏稳定性检验) 以表为例,在用1985—1999年数据建立的模型基础上,检验当把2000—2002年数据加入样本后,模型的回归参数时候出现显著性变化。 * 用F-test作chow间断点检验检验模型稳定性 * chow检验的零假设:无结构变化,小概率发生结果变化 * 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All

多元线性回归模型公式定稿版

多元线性回归模型公式 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

二、多元线性回归模型 在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立 假设某一因变量y 受k 个自变量k x x x ,...,,21的影响,其n 组观测值为 (ka a a a x x x y ,...,,,21),n a ,...,2,1=。那么,多元线性回归模型的结构形式为: a ka k a a a x x x y εββββ+++++=...22110() 式中: k βββ,...,1,0为待定参数; a ε为随机变量。 如果k b b b ,...,,10分别为k ββββ...,,,210的拟合值,则回归方程为 ?=k k x b x b x b b ++++...22110() 式中: 0b 为常数; k b b b ,...,,21称为偏回归系数。

偏回归系数i b (k i ,...,2,1=)的意义是,当其他自变量j x (i j ≠)都固定时,自变量i x 每变化一个单位而使因变量y 平均改变的数值。 根据最小二乘法原理,i β(k i ,...,2,1,0=)的估计值i b (k i ,...,2,1,0=)应该使 ()[]min ...212211012→++++-=??? ??-=∑∑==∧n a ka k a a a n a a a x b x b x b b y y y Q () 有求极值的必要条件得 ???????==??? ??--=??=??? ??--=??∑∑=∧=∧n a ja a a j n a a a k j x y y b Q y y b Q 110),...,2,1(0202() 将方程组()式展开整理后得: ?????????????=++++=++++=++++=++++∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑===================n a a ka k n a ka n a ka a n a ka a n a ka n a a a k n a ka a n a a n a a a n a a n a a a k n a ka a n a a a n a a n a a n a a k n a ka n a a n a a y x b x b x x b x x b x y x b x x b x b x x b x y x b x x b x x b x b x y b x b x b x nb 11221211101 121221221121012111121211121011112121110)(...)()()(...)(...)()()()(...)()()()(...)()( () 方程组()式,被称为正规方程组。 如果引入一下向量和矩阵: 则正规方程组()式可以进一步写成矩阵形式 B Ab =(3.2.15’)

多元线性回归模型基于spss分析

多元线性回归模型 SPSS分 析 学院:数信学院 姓名:唐姣

学号:20124668 班级:统计3班 1.数据生成 根据给定回归模型Y=β0+β1*x1+β2*x2+err 生成100个生成数组(见附表格),其中=105、=0.5,、 =-0.3、err~N(50,6). 建立散点图

由图得知y与x1的线性关系为

由图得知y与x2的线性关系为 综合以上各个变量与y的关系可以综合得知各个x与y的关系为:Y=β0+β1*x1+β2*x2+err 其中:y~被解释变量(因变量)、x1, x2、x3~解释变量(回 归变量, 自变量)b、~回归系数e~随机误差(均值为零的正态分布随机变量) 2.模型拟合概述 列出模型的R、R2、调整的R2和估计标准差,R2

越大反应了两变量的共变量比率越高,模型与数据的拟合程度越好。 Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate 1 1.000a 1.000 1.000 .000000179752611 a. Predictors: (Constant), err, x1, x2 本例所用数据拟合结果显示:所考察的自变量和因变量之间的相关系数为1.000,拟合线性回归的确定性系数为 1.000,经调整后的确定性系数为 1.000,估计标准差0.000000179752611。 3.方差分析表 列出了变异源、自由度、均方、F值及对F的显著性检验

ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regressio n 4705.011 3 1568.337 . .000a Residual .000 97 .000 Total 4705.011 100 a. Predictors: (Constant), err, x1, x2 b. Dependent Variable: y 本例中回归方程显著性检验结果表明:回归平方和为4705.011,残差平方和0.000,总平方和为4705.011,对应的F统计量的值为0.000,显著性水平小于0.05,可以认为所建立的回归方程有效。 4.回归系数表 Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. 95% Confidence Interval for B B Std. Error Beta Lower Bound Upper Bound 1 (Constant) 105.000 .000 1.559E8 .000 105.000 105.000 x1 .500 .000 .303 1.118E8 .000 .500 .500 x 2 -.300 .000 -.13 3 -4.885E7 .000 -.300 -.300

(完整word版)多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。其中已有变量:“c ”—截距项 “resid ”—剩余项。在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。 年份 人口自然增长率 (%。) 国民总收入(亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024

多元线性回归模型公式().docx

二、多元线性回归模型 在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立 假设某一因变量 y 受 k 个自变量 x 1, x 2 ,..., x k 的影响,其 n 组观测值为( y a , x 1 a , x 2 a ,..., x ka ), a 1,2,..., n 。那么,多元线性回归模型的结构形式为: y a 0 1 x 1a 2 x 2 a ... k x ka a () 式中: 0 , 1 ,..., k 为待定参数; a 为随机变量。 如果 b 0 , b 1 ,..., b k 分别为 0 , 1 , 2 ..., k 的拟合值,则回归方程为 ?= b 0 b 1x 1 b 2 x 2 ... b k x k () 式中: b 0 为常数; b 1, b 2 ,..., b k 称为偏回归系数。 偏回归系数 b i ( i 1,2,..., k )的意义是,当其他自变量 x j ( j i )都固定时,自变量 x i 每变 化一个单位而使因变量 y 平均改变的数值。 根据最小二乘法原理, i ( i 0,1,2,..., k )的估计值 b i ( i 0,1,2,..., k )应该使 n 2 n 2 Q y a y a y a b 0 b 1 x 1a b 2 x 2a ... b k x ka min () a 1 a 1 有求极值的必要条件得 Q n 2 y a y a b 0 a 1 () Q n 2 y a y a x ja 0( j 1,2,..., k) b j a 1 将方程组()式展开整理后得:

计量经济学判断题 )

1. 总离差平方和可分解为回归平方和与残差平方和。( 对 ) 2. 整个多元回归模型在统计上是显着的意味着模型中任何一个单独的解释变量均是统计显着的。( 错 ) 3. 多重共线性只有在多元线性回归中才可能发生。( 对 ) 4. 通过作解释变量对时间的散点图可大致判断是否存在自相关。( 错 ) 5. 在计量回归中,如果估计量的方差有偏,则可推断模型应该存在异方差( 错 ) 6. 存在异方差时,可以用广义差分法来进行补救。( 错 ) 7. 当经典假设不满足时,普通最小二乘估计一定不是最优线性无偏估计量。( 错 ) 8. 判定系数检验中,回归平方和占的比重越大,判定系数也越大。( 对 ) 9. 可以作残差对某个解释变量的散点图来大致判断是否存在自相关。( 错 )做残差 ) n 5、经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量将有偏的。错,,即使经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量仍然是无偏的。 因为222)()?(βμββ=+=∑i i K E E ,该表达式成立与否与正态性无关。 1、在简单线性回归中可决系数2R 与斜率系数的t 检验的没有关系。错误,在简单线性回归 中,由于解释变量只有一个,当t 检验显示解释变量的影响显着时,必然会有该回归模型的可决系数大,拟合优度高。 2、异方差性、自相关性都是随机误差现象,但两者是有区别的。正确,异方差的出现总是与模型中某个解释变量的变化有关。自相关性是各回归模型的随机误差项之间具有相关关

系。3、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。 4、满足阶条件的方程一定可以识别。错误,阶条件只是一个必要条件,即满足阶条件的的方程也可能是不可识别的。 5、库依克模型、自适应预期模型与局部调整模型的最终形式是不同的。错误,库依克模型、自适应预期模型与局部调整模型的最终形式是相同的,其最终形式都是一阶自回归模型。2、多重共线性问题是随机扰动项违背古典假定引起的。错误,应该是解释变量之间高度相关引起的. (3) 线性回归模型意味着因变量是自变量的线性函数。(错) (4) 在线性回归模型中,解释变量是原因,被解释变量是结果。(对) 1、虚拟变量的取值只能取0或1(对) 2、通过引入虚拟变量,可以对模型的参数变化进行检验(对) 1、简单线性回归模型与多元线性回归模型的基本假定是相同的。错 在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提 出无多重共线性的假定。 2、在模型中引入解释变量的多个滞后项容易产生多重共线性。对 在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只

多元线性回归模型的各种检验方法

对多元线性回归模型的各种检验方法 对于形如 u X X X Y k k +++++=ββββ 22110 (1) 的回归模型,我们可能需要对其实施如下的检验中的一种或几种检验: 一、 对单个总体参数的假设检验:t 检验 在这种检验中,我们需要对模型中的某个(总体)参数是否满足虚拟假设0 H :j j a =β,做出具有统计意义(即带有一定的置信度)的检验,其中j a 为某个给定的已知数。特别是,当j a =0时,称为参数的(狭义意义上的)显著性检验。如果拒绝0H ,说明解释变量j X 对 被解释变量Y 具有显著的线性影响,估计值j β?才敢使 用;反之,说明解释变量j X 对被解释变量Y 不具有显 著的线性影响,估计值j β?对我们就没有意义。具体检验 方法如下: (1) 给定虚拟假设 0H :j j a =β;

(2) 计算统计量 )?(?)?()(?j j j j j j Se a Se E t βββββ-=-= 的数值; 11?)?(++-==j j jj jj j C C Se 1T X)(X ,其中σβ (3) 在给定的显著水平α下(α不能大于1.0即 10%,也即我们不能在置信度小于90%以下的前提下做结论),查出双尾t (1--k n )分布的临界值2/αt ; (4) 如果出现 2/αt t >的情况,检验结论为拒绝 0H ;反之,无法拒绝0H 。 t 检验方法的关键是统计量 )?(?j j j Se t βββ-=必须服从已 知的t 分布函数。什么情况或条件下才会这样呢?这需要我们建立的模型满足如下的条件(或假定): (1) 随机抽样性。我们有一个含n 次观测的随机样(){}n i Y X X X i ik i i ,,2,1:,,,,21 =。这保证了误差u 自身的随机性,即无自相关性,

多元线性回归模型论文农村居民收入论文

多元线性回归模型论文农村居民收入论文:基于多元线性回归模型的 农村居民收入增长分析 摘要:针对影响安徽省农村居民收入的因素进行分析,再运用实证方法对1995-2009年的经济统计数据进行分析,从而得到影响安徽省农村居民纯收入的多元线性回归模型,通过对模型的验证能有效的预测安徽农村居民的收入增长趋势并能对安徽省农村地区的政策措施提供参考建议。 关键词:影响因素;农村居民收入;多元线性回归模型 0 引言 社会主义新农村建设的首要任务是发展现代农业,其核心是增加农民收入。改革开放30多年来,安徽农民收入的变化大致经历了以下5个阶段:1978-1980年高速增长阶段,农民人均纯收入由1978年的113.34元增加到1981年的246.49元,年均增长29.6%;1982-1991年相对低速增长阶段,其中1991年出现了负增长,农民收入下降了17.3%;1992-1996年为较快增长阶段年增长率均在20%以上;1997-2003年又为低速徘徊阶段;2004-2009年为恢复性较快增长阶段,增速均达到了两位数,从2004年的2499.3元增加到2009年的4504.3元。但是整个农民纯收入的增长与城镇居民的收入相比,表现出了增长缓慢、差距越来越大的趋势。为此本文根据整个国民经济的发展以及安徽省农业产业政策的调整变化、农村居民自身人力资本的积累等因素的变化情况,对安徽省农村居民纯收入的中长期趋势进行

合理的预测,通过对1995-2009年安徽农村居民人均纯收入等经济统计数据的分析,运用多元线性回归方法建立模型,找出影响安徽农村居民纯收入最主要的因素,为安徽省农村产业政策提供建议。 1 影响安徽农村居民纯收入的影响因素 1.1 工资收入对安徽农村居民纯收入的影响 改革开放以来,作为人口大省的安徽,一直是劳务输出大省,农村居民的外出劳务时间越来越长,从事的职业越来越多。如表1所示,人均工资性收入在安徽农村居民人均总收入中所占的比重越来越大,由1995年的11.6%增长到2009年的31.4%,由1995年的234.21元增长到了2009年的1882.42元,十五年增加了1648.21元。 1.2 人均农林牧渔业总产值对安徽农村居民纯收入的影响 从近几年看,安徽农村居民的年纯收入稳步增长。一方面是由于党中央、国务院高度重视农民收入问题,连续6年出台涉农“一号文件”,取消了农业税和农产品特产税,推行了粮食直补和综合补贴等积极扶农的财政政策,不断的调整农业产业结构等;一方面由于安徽省近年来农业机械化程度不断提高,以及农业科技的发展和较好的种养殖天气环境等为农产品稳产、高产提供了坚实基础,安徽省农林牧渔业总量不断创出新高。如图1、图2示,农业机械总动力由1995年的1836万千瓦增加到2009年的5108.8万千瓦。安徽省农林牧渔业总值有1995年的980.26亿元增加到2009年的2569.46亿元。 数据来源:安徽省国民经济和社会发展公报(1995-2009);安

计量经济学习题第2章 一元线性回归模型

第2章 一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。 A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。 A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。 A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。 A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。 A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。 A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。 A ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β ∑∑= D i i i i 1 2x n X Y -X Y ?βσ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以?σ表示估计标准误差,r 表示相关系数,则有__________。 A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。 A 产量每增加一台,单位产品成本增加356元 B 产量每增加一台,单位产品成本减少1.5元 C 产量每增加一台,单位产品成本平均增加356元 D 产量每增加一台,单位产品成本平均减少1.5元 10、在总体回归直线01 ?E Y X ββ+()=中,1β表示__________。

相关主题