《统计学原理》作业(三)
(第五~第七章)
一、判断题
1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避
免的会产生误差,这种误差的大小是不能进行控制的。(×)
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×)
3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
(√ )
4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。
(×)
5、抽样极限误差总是大于抽样平均误差。(×)
6、相关系数是测定变量之间相关关系的唯一方法(×)
7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95, 则乙比甲的相关程度高(√)。
8、利用一个回归方程,两个变量可以互相推算(×)。
9、估计标准误指的就是实际值y 与估计值y c的平均误差程度(√)。
10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×)
11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。
(√)
12、在一定条件下,施肥量与收获率是正相关关系。(√)
二、单项选择题
1、在一定的抽样平均误差条件下(A)。
A、扩大极限误差范围,可以提高推断的可靠程度
B、扩大极限误差范围,会降低推断的可靠程度
C、缩小极限误差范围,可以提高推断的可靠程度
D、缩小极限误差范围,不改变推断的可靠程度
2、反映样本指标与总体指标之间的平均误差程度的指标是(
C)。
A 、抽样误差系数B、概率度
C、抽样平均误差
D、抽样极限误差
3、抽样平均误差是( C )。
A 、全及总体的标准差B、样本的标准差
C、抽样指标的标准差
D、抽样误差的平均差
4、当成数等于(C)时,成数的方差最大。
A 、 1
B 、 0c、 0.5D、 -1
5、对某行业职工收入情况进行抽样调查,得知其中80% 的职工收入在800 元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800 元以下所占比重是(C)。
A 、等于 78%
B 、大于 84%c、在此 76%与 84% 之间 D 、小于 76%
6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂
工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。
A 、甲厂比乙厂大B、乙厂比甲厂大
C、两个工厂一样大
D、无法确定
7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。
A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。
8、如果变量x 和变量 y 之间的相关系数为 1 , 说明两变量之间( D )。
A 、不存在相关关系B、相关程度很低
C、相关程度显著
D、完全相关
9、一般说 ,当居民的收入减少时, 居民的储蓄款也会相应减少, 二者之间的关系是 ( A ) 。
A、直线相关
B、完全相关 C 、非线性相关 D 、复相关
10、年劳动生产率x( 千元 ) 和工人工资 y( 元 ) 之间的回归方程为y c=30+60x , 意味着劳动生产率每提高 2千元时 , 工人工资平均增加 ( B )。
A、60 元
B、 120 元
C、30 元
D、90元
11、如果变量 x和变量 y 之间的相关系数为 -1 ,说明两个变量之间是( B )
A、高度相关关系 B 、完全相关关系
C、完全不相关
D、低度相关关系
12、价格不变的条件下,商品销售额和销售量之间存在着(
D)。
A 、不完全的依存关系
B 、不完全的随机关系
C、完全的随机关系 D 、完全的依存关系
三、多项选择题
1、影响抽样误差大小的因素有(ABCD )。
A 、抽样调查的组织形式
B 、抽取样本单位的方法
C、总体被研究标志的变异程度 D 、抽取样本单位数的多少
E、总体被研究标志的属性
2、在抽样推断中(ACD)。
A 、抽样指标的数值不是唯一的
B 、总体指标是一个随机变量
C、可能抽取许多个样本 D 、统计量是样本变量的涵数
E、全及指标又称为统计量
3、从全及总体中抽取样本单位的方法有(BC)。
A 、简单随机抽样B、重复抽样c、不重复抽样
D、概率抽样
E、非概率抽样
4、在抽样推断中,样本单位数的多少取决于(ABCE)。
A 、总体标准差的大小
B 、允许误差的大小
C、抽样估计的把握程度 D 、总体参数的大小E、抽样方法
5、总体参数区间估计必须具备的三个要素是(BDE)。
A 、样本单位数B、样本指标c、全及指标
D、抽样误差范围
E、抽样估计的置信度
6、在抽样平均误差一定的条件下(AD)。
A、扩大极限误差的范围,可以提高推断的可靠程度
B、缩小极限误差的范围,可以提高推断的可靠程度
C、扩大极限误差的范围,只能降低推断的可靠程度
D、缩小极限误差的范围,只能降低推断的可靠程度
E、扩大或缩小极限误差范围与推断的可靠程度无关
7、判定现象之间有无相关关系的方法是(ABCD)。
A、对客观现象作定性分析B、编制相关表C、绘制相关图
D、计算相关系数E、计算估计标准误
8、相关分析特点有(BCDE)。
A. 两变量不是对等的
B.两变量只能算出一个相关系数
C.相关系数有正负号
D.两变量都是随机的
E.相关系数的绝对值介于0 和 1 之间
9、下列属于负相关的现象是(ABD )。
A 、商品流转的规模愈大,流通费用水平越低
B、流通费用率随商品销售额的增加而减少
C、国民收入随投资额的增加而增长
D、生产单位产品所耗工时随劳动生产率的提高而减少
E、某产品产量随工人劳动生产率的提高而增加
10、变量x 值按一定数量增加时,变量 y 也近似地按一定数量随之增加,反之亦然 ,则 x 和 y 之间存在 (AB)。
A 、正相关关系B、直线相关关系C、负相关关系
D、曲线相关关系
E、非线性相关关系
四、简答题
1、举例说明总体、样本、参数、统计量、变量这几个概念。
答题要点:对1000 个灯泡进行寿命测试,那么1000 个灯泡就是总体,从中抽取100个进行检测,这100 个灯泡的集合就是样本,这1000 个灯泡的寿命的平均值和标准差、还
有合格率等描述特征的数值就是参数,这 100 个灯泡的寿命的平均值和标准差、还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
2、什么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算公式。
答题要点:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差
的最大范围的指标,二者既有联系又有区别。
二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即tu 。
二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。
抽样平均误差的计算:
重复抽样: u x u x
p(1p)
n
n
2
n )p(1p) (1n )不重复抽样: u x(1u x
n N n N 抽样极限误差的计算:
x tu x
p tu p
3、解释相关关系的含义,说明相关关系的特点。
相关关系是一种不完全确定的随机关系,在相关关系的情况下,因素标志的每个数值都
可能有若干个结果标志的数值与之对应。因此,相关关系是一种不完全的依存关系。
相关关系的特点:( 1)现象之间确实存在着数量上的依存关系;( 2)现象之间数量上的关系是不确定、不严格的依存关系
4、请写出计算相关系数的简要公式,并说明相关系数的取值范围及其判断标准。
答题要点:计算相关系数的简化式:
n xy x y
n x2x 22 n y2y
①相关系数的数值范围是在-1 和 +1 之间,即1x 1, r 0为正相关,r0 为负相关。
②判断标准: r 0.3 为微弱相关; 0.3 r0.5为低度相关; 0.5 r0.8为显著相关;
0.8 r 1为高度相关;r0 时,不相关,r1时完全相关。
5、拟合回归方程y c a bx 有什么前提条件?写出参数a, b 的计算公式并解释经济含义。
答题要点:拟合直线回归方程的要求是(1) 两变量之间确实存在线性相关关系;(2)两变量相关的密切程度必须显著;(3)找到合适的参数a, b ,使所确定的回归方程达到使实际的y 值与对应的理论值y c的离差平方和为最小。
回归方程 y c a bx 中参数a, b的计算公式:
n xy x y
1.82, a y bx
b
x 2( x)2
n
a, b 经济含义:(1)回归方程中参数 a 代表直线的起点值,在数学上称为直线的纵轴
截距,它表示x 0 时 y 的常数项。(2)参数 b 称为回归系数,表示自变量x 增加一个单位时因变量y 的平均增加值。回归系数的正负号与相关系数是一致的,因此可以从回归系数
的正负号判断两变量相关的方向。
五、计算题
1、外贸公司出口一种食品,规定每包规格不低于150 克,现在用重复抽样的方法抽取其中
的 100 包进行检验,其结果如下:
每包重量(克)包数
148- 14910
149- 15020
150- 15150
151- 15220
——100
要求:( 1)以 99.73% 的概率估计这批食品平均每包重量的范围,以便确定平均重量是
否达到规格要求;
( 2)以同样的概率保证估计这批食品合格率范围。
解: p
70
0.7
100
xf15030
x150.3
f100
x2x f
0.87
f
x
0.87
0.087 n100
x
t 3 0.087 0.261
x
x 150.3 0.261即 150.04,150.561
p
p(1 p)
0.0458
n
p
t
p
3 0.0458 0.1374
p p
0.7
0.1374即 0.5626,
0.8374
2、单位按简单随机重复抽样方式抽取 40 名职工, 对其业务情况进行考核, 考核成绩资料如
下:
68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76
95 76 71 60 91 65 76
72 76 85 89 92
64
57
83
81 78
77
72 61
70
87
要求:( 1)根据上述资料按成绩分成以下几组: 60 分以下, 60- 70 分, 70- 80 分, 80- 90
分, 90- 100 分,并根据分组整理成变量分配数列
;(2)根据整理后的变量数列,以95.45%
的概率保证程度推断全体职工业务考试成绩的区间范围 ;( 3)若其它条件不变,将允许误差
范围缩小一半,应抽取多少名职工?
解:
成绩
组中值 人数 比重
60 分以下 55 3 7.5% 60- 70 65 6 15% 70- 80 75 15 37.5% 80- 90
85 12 30% 90- 100
95
4 10%
合计
40
100%
x
xf
3080
77(分 )
f
40
x x
2
4440
= f
10.54( 分)
f
40
x
10.54
1.67
n
40
x
t x
2 1.67 3.34
x
x
77 3.34 73.66,80.34
t 22410.542444.3664
n
22
160
2.9889
3.34
2
3、采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。要求:
(1)计算样本的抽样平均误差
(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(t=2)
解: p
195
97.5%
200
p
p(1 p)0.975 0.025
0.011
n200
p t p 2 0.0110.022
p p0.975 0.0220.953,0.997
95.3% p99.7%
4、某企业上半年产品产量与单位成本资料如下:
━━━━━┯━━━━━━━┯━━━━━━━━━━━━
月份│产量(千件)│单位成本(元)
─────┼───────┼───────────
1│2│73
2│3│72
3│4│71
4│3│73
5│4│69
6│5│68
━━━━━┷━━━━━━━┷━━━━━━━━━━━要求:(1)计算相关系数,说明两个变量相关的密切程度。
(2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?(3)假定产量为6000件时,单位成本为多少元?
产量 x成本 y xy x 2y 2
27314645329
37221695184
471284165041
37321995329
4 69 276 16 4761
5 68 340 25 4624 合计
426
1481
79
30268
r
n
xy
x
y
60 60
2
2
33 132
0.91
n x x 2
y y 2
66
n
y c
a bx
n
xy xy
1.82
b
x 2
2
n x
a y bx 77.37
y c 77.37 1.82x
x=6 代入方程
y c 77.37 1.82 6
66.45(元 )
5、根据某地区历年人均收入 ( 元) 与商品销售额(万元)资料计算的有关数据如下
: (x 代表
人均收入 ,y 代表销售额 )
n=9
x =546 y =260 x 2 =34362 xy =16918
计算 : (1) 建立以商品销售额为因变量的直线回归方程
, 并解释回归系数的含义;
(2) 若 1996 年人均收为 400 元 , 试推算该年商品销售额
。
6、解:设回归方程表达式为
y c a
bx
b
n
xy
x
y 10302
0.92
2
2 11142
n x
x
a
y bx
260 0.92
546 26.92
9
9
当人均收入增加 1 元,销售额平均增加
0.92 万元
x=14000 代入
y c
26.92 0.92 14000 12853.08
7、某地区家计调查资料得到 ,每户平均年收入为 8800 元 ,方差为 4500 元 ,每户平均年消费支
出为 6000 元 ,均方差为60 元 ,支出对于收入的回归系数为0.8,要求 : (1) 计算收入与支出的相关系数;
(2)拟合支出对于收入的回归方程;
(3)收入每增加 1 元 ,支出平均增加多少元。
解:x 67.082x 8 8 0 0
y60y 6000
x r b
y
67.082
0.80.89
60
a y bx60000.8 8800 1040
y c10400.8 x
收入每增加 1 元,支出平均增加0.8 元。
8、某企业生产一批零件,随机重复抽取400 只做使用寿命试验。测试结果平均寿命为5000小时,样本标准差为 300 小时, 400 只中发现 10 只不合格。根据以上资料计算平均数的抽样平
均误差和成数的抽样平均误差。
解:平均数的抽样平均误差为x
300
15 (小时)n400
成数的抽样平均误差为x
p(1 p)0.025(1 0.025)
n 0.0078
400