搜档网
当前位置:搜档网 › 统计学第5-6章 正态分布、 统计量及其抽样分布

统计学第5-6章 正态分布、 统计量及其抽样分布

统计学第5-6章 正态分布、 统计量及其抽样分布
统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布

正态分布

5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。

概率密度曲线图

例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量

如果随机变量X 的概率密度为

22

()21

(),2x f x e

x μσπσ

--=-∞<<∞

则称X 服从正态分布。

记做

2

(,)X

N μσ,读作:随机变量X 服从均值为μ,方差为2

σ的正态分布 其中,

μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的

标准差

5.1.2正态密度函数f(x)的一些特点:

()0

f x≥,即整个概率密度曲线都在x轴的上方。

曲线

()

f x相对于xμ

=对称,并在xμ

=

处达到最大值,

1

()

2

πσ

=

1

μ<

2

μ<

3

μ

曲线的陡缓程度由

σ

决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当

x

趋于无穷时,曲线以x轴为其渐近线。

标准正态分布

0,1

μσ

==

时,

2 2

1 ()

2x

f x e

π-

=

x

-∞<<∞

(0,1)

N

为标准正态分布。

标准正态分布的概率密度函数:

()x ?

标准正态分布的分布函数:

()x Φ

任何一个正态分布都可以通过线性变换转化为标准正态分布

2

(,)

X Nμσ

,则

(0,1)

X

Z N

μ

σ

-

=

变量

2

11

(,)

X Nμσ与变量2

22

(,)

Y Nμσ相互独立,则有

22

1212

+(+,+) X Y Nμμσσ

5.1.3 正态分布表:可以查的正态分布的概率值()1()

x x

Φ-=-Φ

例:设

(0,1)

X N,求以下概率

(1)( 1.5)P X <

(2) (2)P X >

(3)

(13)P X -<≤

(4) (2)P X ≤

解:

(1) 1.5

( 1.5)()(1.5)0.9332P X t dt ?-∞<==Φ=?

(2)

(2)1(2)1210.97730.0227

P X P X >=-≤=-Φ=-=() (3)

(13)(3)(1)(3)(1)

(3)(1(1))0.9987(10.8413)0.84

P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)

(2)(22)(2)(2)

(2)(1(2))2(2)10.9545

P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=

一般,若

(0,1)X

N ,则有

()()()P a X b b a <≤=Φ-Φ

()2()1P X a a ≤=Φ-

例 设

2

(5,3)X

N ,求以下概率

(1)(10)P X ≤

(2)

(210)P X <<

(3)

(28)P X ≤≤

(4)

(56)P X -≤ (5)

(59)P X -≤

解:由2

(5,3)X

N ,

5(0,1)3

X N -

(1)

1.675105

(10)()

33

5( 1.67)

3()(1.67)0.9522

X P X P X P t dt ?-∞

--≤=≤-=≤==Φ=?

(2) 255105

(210)()

333

5

(1 1.67)

3(1.67)(1)0.7938

X P X P X P ---<<=<<-=-<<=Φ-Φ-=

(3)

25585

(28)()

333

5

(11)

32(1)120.841310.6826

X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=?-=

(4)

56

(56)()

33

5(2)

32(2)120.977210.9544

X P X P X P --≤=≤-=≤=Φ-=?-=

(5)

5

(59)(

3)

3

2(3)120.998710.9974

X P X P --≤=≤=Φ-=?-=

一般,若2(,)X

N μσ,则有

()()()b a P a X b μμ

σσ

--<≤=Φ-Φ

准则

(0,1)X N ,则有

(1)2(1)10.6826P X ≤=Φ-=

(2)2(2)10.9545P X ≤=Φ-=

(3)2(3)10.9973P X ≤=Φ-=

即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到%

至一般正态总体,即

2

(,)X

N μσ,有

()0.6826P X μσ-≤=

(2)0.9545P X μσ-≤=

(3)0.9973P X μσ-≤=

显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区

间(3,3)μσμσ-+内——统计学的“3σ准则”

5.1.5 正态分布函数的一个重要性质 设变量211(,)X

N μσ,2

22(,)Y N μσ~,X 与Y 相互独立,则有

221212

+(+,+)X Y N μμσσ2

2121

2

-(-,+)X Y

N μμσσ

5.1.6 求分位数

Z α

()0,1X

N

()()Z P X Z x dx α

α?α∞

≥==?

1-=-Z Z αα

常用的几个Z 分位数:

0.050.0251.64, 1.96Z Z ==

0.950.975-1.64,-1.96Z Z ==

由正态分布导出的几个重要分布

三大分布:

2

,,t F χ分布

5.2.1

分布

1 定义:设随机变量

12,,,n

X X X 相互独立,且

(0,1)

i

X N (1,2,

,)i n =,则它们的平方和服从自由度为

n 的

2

x

分布。

记做,

22

()i X

n χ∑

2 2

x 分布的密度函数图形

图形特点:

(1)

2

x

分布的变量值始终为正。

(2)

2

x

分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,

随着自由度的增大逐渐趋于对称。 (3)2

x

分布的期望为2

()E n χ

=,方差为2

()2D n χ

=(n 为自由

度)。 (4)

2

x

分布具有可加性。

X Y

与是相互独立的随机变量,

21~(),X x n 22~()Y x n ,则它

们的和服从于自由度为

12

n n +的

2

x

分布,即

212~()X Y x n n ++。

3 2x 分布临界值表的使用,求得2

x 分布的分位数

2x 分布临界值表中给出的是概率为α

时,2

x α的取值,k 是自由度。

22

2

()()x P x x f x dx α

αα+∞

≥==?

x α

例如,若随机变量

2

(10)X

χ,

则查表可得

20.05

(10)

3.94χ

=,20.95

(10)18.307χ

=,

5.2.2 t 分布(student 分布)

设随机变量

,X Y

互相独立,

2

~(0,1),~()X N Y x n ,则随机变量

~()X t t n =——自由度为n 的t 分布

t 分布概率密度函数图

特点:

① 关于y 轴对称,与标准正态分布的密度函数的图像非常相似。 ② 厚尾:当

x →∞时,t 分布的密度函数趋于0的速度要比标准正态

分布密度函数慢,所以t 分布的密度函数的尾部要比(0,1)N 密度

的尾部厚些。

③ 当自由度n 无限增大时,t 分布将趋近于标准正态分布。

所以,当n 很大时,t 分布可以用标准正态分布近似。记()t n α为分

()t n 的α

分位数。

在实际使用中,当

30n ≥,就近似有 ()t n Z αα≈

α

由于t 分布密度曲线的对称性,可得

1()()t n t n αα-=-

例如,若随机变量(15)T t ,查表可得,0.05(15) 1.7531t =,

而0.95

0.05(15)(15) 1.76531t

t =-=-

0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =

可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。 5.2.3 F 分布

设随机变量X 与Y 相互独立且分别服从自由度为m 和n 的2

χ分布。

则随机变量//X m

F Y n

=

服从第一自由度为

m

第二自由度为

n

的F 分布。

记为

()F

F m n ,

x

F 分布的概率密度函数的图

设随机变量

(,)F

F m n ,

(,)F m n α表示分布(,)F m n 的α

分位数,

α

可以证明

11

(,)(,)

F m n F n m αα-=

例如查表得

0.95F (8,9)=3.23,

则0.050.950.31F F 11

(9,8)==(8,9) 3.23

小概率原理

指发生概率很小的随机事件在一次实验中几乎不可能出现。 统计量

定义:设

12,,,n X X X 是从总体X

中抽取的容量为

n

的一个样本,

如果由此样本构造一个不依赖于任何未知参数的函数

12(,,

,)n T X X X ,则称函数12(,,,)n T X X X 是一个统计量。

特点:

由样本构造而得,是样本的函数 不含任何未知的参数

当获得样本的一组具体观测值

12(,,

,)n x x x ,带入T

,计算出

12(,,

,)n T x x x 的数值,称为统计量的值

常用的统计量2

,X S

抽样分布

抽样分布:统计量的分布

随机变量X

精确分布:可以得到分布的数学表达式

渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。

定理1:

设()

12

,,,

n

X X X

是取自总体X的一个样本,记()i

E Xμ

=,2

()

i

D Xσ

=,那么

()

E Xμ

=,2

()

D X

n

σ

=

22

()

E sσ

=,22

1

()

n

n

E s

n

σ

-

=

③当n→∞

时,

P

??→

lim ()1n P X με→∞

-<=

④ 当n →∞时,22

P s σ??→,

2

2

P n

s σ

??→

定理2:

()12,,

,n X X X 是取自正态总体2

(,)N μσ的一个样本

2

(,)X

N n σ

μ

,或等价地

(0,1)X N μ

-

2

2

2

2

2

2

2

()

(1)(1)i

n X X ns

n s

n χσ

σ

σ

--=

=

-∑

③ X 与2

s 相互独立

推论1:

()

12,,,n X X X 是取自正态总体

2(,)

N μσ

的一个样本,那么

(1)

/X t n s μ--

简要证明:

2(,)X N μ

σ(0,1)

X N μ

-?

2

22

(1)(1)

n s n χσ--

(1)

X t n μ-?

- 独立(t 分布的定义)

(1)

X t n μ

--

推论2

()

12,,,m X X X 是取自正态总体

211(,)

N μσ的一个样本,

()

12,,

,n Y Y Y 是取自正态总体

2

22(,)

N μσ的一个样本,

X

与Y 相互独立,那么

()()

(0,1)

X Y N μμ---

简要证明:

211

(,)X

N μσ21

1(,

)

X

N m

σ

μ?

222

(,)

Y

N μσ22

2(,

)

Y

N n

σ

μ?

独立,

2

212

12(,

)

X Y

N m

n

σσμμ--+

12()()

(0,1)

X Y N μμ---

推论3:

()

12,,,m X X X 是取自正态总体

21(,)

N μσ的一个样本,

()

12,,,n Y Y Y 是取自正态总体

22(,)

N μσ的一个样本,

X 与Y 相互独立,那么

()()

(2)

X Y t m n μμ---+-

其中,

22

21

2

(1)(1)(2)p

m s n s s m n -+-=

+-

简要证明:

2

1(,)X

N μσ2

1(,

)X

N m

σ

μ?

2

2(,)

Y

N μσ2

2(,

)Y

N n

σ

μ?

独立,

2

2

12(,

)

X Y

N m

n

σ

σ

μμ--+

22

1

2

(1)(1)

m s

m χσ

--

22

2

2

(1)(1)n s

n χσ

--

可加性

222

1

2

2

2

(1)(1)(2)m s

n s

m n χσ

σ

--+

+-

()()

(2)

X Y t m n μμ---?

+-

整理得

()()

(2)

X Y t m n μμ---?

+-

设222

12

(1)(1)(2)

p

m s n s s m n -+-=+-

()()

(2)

X Y t m n μμ---+-

推论4: 设()12,,

,m X X X 是取自正态总体211(,)N μσ的一个样本,

()12,,

,n Y Y Y 是取自正态总体2

22

(,)N μσ的一个样本, X

Y 相互独立,那么

2211

22

22

/(1,1)/s F m n s σσ-- 简要证明: 正态

2

11

(,)X

N μσ2

212

1(1)(1)m s m χσ-?

-

222

(,)Y

N μσ2

22

22

(1)(1)n s n χσ-?

-

21

21

22

22

(1)/(1)

(1,1)

(1)/(1)

m s m F m n n s

n σ

σ

--?

----

2211222

2

/(1,1)

/s F m n s σσ

--

非正态总体的情形

定理:设

()12,,,n X X X 是取自总体X 的一个样本,当n 较大

时,近似地有

(0,1)

X N μ-

(0,1)

X N μ-

《统计学》 第六章 统计指数(补充例题)

第六章 统计指数 (3)由于每种商品和全部商品价格变动试该试居民增加支出的金额。 解:(1)各商品零售物价的个体指数见下表: (2)四种商品物价总指数%2.111598 .55840 .611 011== = ∑∑q p q p 四种商品销售量总指数%8.116595 .47598 .550 01 == = ∑∑p q p q (3)由于全部商品价格变动使该市居民增加支出为61.840-55.598=6.242(万元) 其中 蔬菜价格的变动占4.680-4160=0.520万元; 猪肉价格的变动占38.640-35.328=3.312万元; 蛋价格的变动占5.520-5.060=0.460万元; 水产品价格的变动占13.000-11.050=1.950万元。 通过分析可看出,猪肉价格变动影响最大,占居民增加支出金额的53.1%,其次是水产品,占居民增加支出金额的31.2%。 例2、某工业企业生产甲、乙两种产品,基期和报告期的产量、单位产品成本和出厂价格资

试计算: (1)以单位成本为同度量因素的产量总指数 (2)以出厂价格为同度量因素的产量总指数 (3)单位成本总指数 (4)出厂价格总指数 (1)以单位成本为同度量因素的产量总指数%7.11931000 37100 001== =∑∑z q z q (2)以出厂价格为同度量因素的产量总指数 %6.1155500063600 01== = ∑∑p q p q (3)单位成本总指数%2.14837100 55000 1 011== = ∑∑q z q z (4)出厂价格总指数%8.9963600 63500 1 011== = ∑∑q p q p 例3、试根据例2的资料,从相对数和绝对数方面分析: (1)总成本变动受产量和单位成本变动的影响程度 (2)销售额变动受产量和出厂价格变动的影响程度 解:(1)总成本变动: 总成本指数%4.17731000 55000 01 1== = ∑∑q z q z 增加总成本 ∑∑=-=-2400031000550000 01 1q z q z (元) 其中由于产量变动的影响: 产量指数%7.11931000 37100 001== = ∑∑z q z q

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样 总体则是不确定的。(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。 (X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。(X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。(X ) 6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准 确程度的范围;两者既有区别,又有联系。( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。(V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。( V ) 10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。 (X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为 原来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误 差等于30。(X) 18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概 率保证程度。(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

应用统计学:参数估计习题及答案.(优选)

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学 第六章 抽样与参数估计

《统计学》 第六章 抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。 解: 已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时) 灯管数(只)f 组中值x xf f x x 2)(- 800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样总 体则就是不确定的。( V ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。 ( X ) 3.在抽样推断中,作为推断的总体与作为观察对象的样本都就是确定的、唯一 的。(X ) 4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。( X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。( X ) 6.抽样平均误差就是表明抽样估计的准确度,抽样极限误差则就是表明抽样估 计准确程度的范围;两者既有区别,又有联系。 ( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。( V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。 ( V ) 10.抽样推断就是利用样本资料对总体的数量特征进行估计的一种统计分析方 法,因此不可避免的会产生误差,这种误差的大小就是不能进行控制的。 (X ) 11.重复抽样时,其她条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。(X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号就是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为原 来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度与总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0、9545,则抽样平均误差等 于30。(X) 18.抽样估计置信度就就是表明抽样指标与总体指标的误差不超过一定范围的 概率保证程度。(V ) 19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学作业抽样推断

第六章抽样推断 单项选择题 1. 抽样调查的主要目的在于( A. 计算和控制误差 B. 了於总休门占忖况C .用样本来推断总体D.对调查单位作深入的研究 2. 抽样调查所必须遵循的基本原则是( A. 随意原则 B. 可比性原则 C.准确性原则 D. I?琳,Q!l] 3. 下列属于抽样调查的事项有(I, A.勾了测卫丫、川勺1上1弍交.炖们剧対:—y 丨ii悄一爪匚人进i「讥育 B. 为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查 c.对某城市居民1%旳宗應询&,以妙.工玄城liji/- /■:旳消赞水半 D. *4找可】个分,"I帆俱一人分!甘讦讦杳,L):佟研究该「術渐和L徴杲 4. 无偏性是指( A.抽样指标等于总体指标 B.fl-木平均数询平均K^T总体平均数 c .样本平均数等于总体平均数 D. 样木成数需」血依成敖 5. 一致性是指当样本的单位数充分大时,抽样指标( A.小于总体指标 B.等于总体指标 C .大于总体指标 D.充分靠近总体指标 6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有()。 A.前者小于后者 B. 前者大于后者C .两者相等 D. 不计 7. 能够事先加以计算和控制的误差是():: A.抽样误差 B. 登记误差 C.代表性误差 D. 系號件汉辛 8. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差(汇 A.第一工厂大 B. 第二个工厂大 C .两工厂一样大D. 无f ■.浪「I沽壬 9. 抽样平均误差是指抽样平均数(或抽样成数)的(L A.平均数 B. 平均差C .标准差D. 标准去丸数 10. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( A.两者相等 B. 两者不等 C.前者小于后者 D. IPJ 11. 反映抽样指标与总体指标之间抽样的可能范围的指标是(

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

统计学课后习题答案第六章_抽样调查

第六章抽样调查 一、单项选择题 1.抽样调查所必须遵循的原则是 A.灵活性原则 B.可靠性原则 C.随机性原则 D.准确性原则 2.抽样调查的目的的在于 A.对调查单位作深入研究 B.用样本指标推断总体指标 C.计算和控制抽样误差 D.了解抽样总体全面情况 3.抽样调查与其他非全面调查的主要区别在于 A.选取调查单位的方式不同 B.调查的目的不同 C.调查的对象不同 D.调查的误差不同 4.抽样调查中 A.只有登记性误差,没有代表性误差 B.只有代表性误差,没有登记性误差 C.既有登记性误差,也有代表性误差 D.既无登记性误差,也无代表性误差 5.抽样调查是建立在下列哪一理论的基础上? A.数学理论 B.统计理论 C.概率论大数定律 D.经济理论 6.抽样误差是指 A.计算过程中所产生的误差 B.随机性的代表性误差 C.调查中产生的登记性误差 D.调查中所产生的系统性误差 7.重复抽样误差与不重复抽样误差相比 A.前者大于后者 B.后者大于前者 C.两者相等 D.两者无关 8.抽样平均误差反映了样本指标与总体指标之间的 A.实际误差 B.实际误差的绝对值 C.平均误差程度 D.可能误差围 9.抽样平均误差是指抽样平均数(成数)的 A.平均数 B.平均差 C.标准差 D.标准差系数 1.反映样本指标与总体指标之间的抽样误差的可能围的 指标是 A.抽样误差 B.抽样平均误差 C.概率保证程度 D.抽样极限误差 11.抽样极限误差和抽样估计的可靠程度(概率保证程度)之间的关系是 A.抽样极限误差越大,概率保证程度越大 B.抽样极限误差越小,概率保证程度越大 C.抽样极限误差越大,概率保证程度越小 D.抽样极限误差不变,概率保证程度越小 12.当抽样误差围扩大时,抽样估计的可靠性将 A.保持不变 B.随之缩小 C.随之扩大 D.无法确定

统计学第六章习题

第六章统计指数 一、单项选择题 1、社会经济统计中的指数是指< )。 ①总指数②广义的指数 ③狭义的指数④广义和狭义指数 2、根据指数所包括的范围不同,可把它分为< )。 ①个体指数和总指数②综合指数和平均指数 ③数量指数和质量指数④动态指数和静态指数 3、编制综合指数时对资料的要求是须掌握< )。 ①总体的全面调查资料②总体的非全面调查资料 ③代表产品的资料④同度量因素的资料 4、设P表示商品的价格,q表示商品的销售量,说明了< )。 ①在报告期销售量条件下,价格综合变动的程度 ②在基期销售量条件下,价格综合变动的程度 ③在报告期价格水平下,销售量综合变动的程度 ④在基期价格水平下,销售量综合变动的程度 5、根据指数所反映现象的数量特征不同,可把它分为< )。 ①拉氏指数和帕氏指数②综合指数和平均指数 ③数量指数和质量指数④动态指数和静态指数 6、拉氏指数所选取的同度量因素是固定在< )。 ①报告期②基期③假定期④任意时期

7、帕氏指数所选取的同度量因素是固定在< )。 ①报告期②基期③假定期④任意时期 8、设P表示商品的价格,q表示商品的销售量,帕氏价格指数的公式 是< )。 ①②③④ 9、设P表示商品的价格,q表示商品的销售量,拉氏销售量指数的公 式是< )。 ①②③④ 10、编制数量指标综合指数时,一般是采用< )作同度量因素。 ①报告期数量指标②基期数量指标 ③报告期质量指标④基期质量指标 11、编制质量指标综合指数的一般是采用< )作同度量因素。 ①报告期数量指标②基期数量指标 ③报告期质量指标④基期质量指标 12、某地区职工工资水平本年比上年提高了5%,职工人数增加了2%, 则工资总额增加了< )。 ①7% ②7.1% ③10% ④11%b5E2RGbCAP 13、单位产品成本报告期比基期下降5%,产量增加5%,则生产费用 < )。 ①增加②降低③不变④难以判断

统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,

2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

统计学习题答案_第4章__抽样与抽样分布

第4章 抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值: 解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样

社会统计学的名词解释

社会统计学的名词解释 非参数检验:泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 符号检验:181页 配对符号秩检验:183页 秩和检验方法:把两个样本混合起来,从小到大进行编号;分别计算两个样本的秩和;;计算检验统计量U;如果计算出的U只小于或等于从附表10中查处的临界值,则零假设被拒绝。 游程检验:把样本1和样本2混合起来,按数值从小到大编号;点算游程数目,以混合样本中游程数目r为检验统计量。 确定性关系:一个变量值确定后,另一个变量值也就完全确定了。 非确定性关系:给定了一个变量值,另一个变量值还可以在一定的范围内变化。 相关系数r:这一指标用来度量相关关系程度或强度。就线性相关来说,当\r\=1时,表示完全相关;当0<\r\<1时,表示不完全相关;当\r\=0时,表示无相关或零相关。 判断两个变量有因果联系的条件:(1)两个变量有共变关系;(2)两个变量之间的关系不是有其他因素形成的;(3)两个变量的产生和变化有明确的时间顺序。 列联表:按品质标志吧两个变量的频数分布进行交互分类,由于表内的每一个频数都需同时满足两个变量的要求,所以列联表又称条件频数表。 消减误差比例(PRE)=(原来的误差—后来的误差)\原来的误差 Gamma系数:适用于测量两对称的定序变项的相关系数。 积差系数:两个定距变量之间的相关测量,最常用的就是积差系数。英国统计学家皮尔逊用积差方法推导出来的,所以也称皮尔逊相关系数,用符号r表示。 回归:有一种力量使子辈个体身高趋向父辈平均身高,高尔顿把这种趋向中心的现象称之为回归。 拟合优度检验:检验总体是否具有正态或其他分部形式的非参数统计检验。 方差分析:他可以检验多个总体均值是否存在差异的统计检验方法。 时间数列:是某一指标的数值按时间按先后顺序排列而成的一个序列,也称动态数列。一般有两个基本要素构成:被研究对象所属的时间和反映该现象在各个时

统计学第5-6章 正态分布 统计量其抽样分布

第5-6章 统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ:,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的标准差 5.1.2正态密度函数f(x)的一些特点: ()0f x ≥,即整个概率密度曲线都在x 轴的上方。 曲线 ()f x 相对于x μ=对称,并在 x μ=处达到最大值,

1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。

标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N :,求以下概率 (1) ( 1.5) P X< (2) (2) P X> (3) (13) P X -<≤

第章统计学参数估计练习题

第7 章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用______ _去估计________ _ 。 2?点估计就是用______________ 的某个取值直接作为总体参数的 ____________ 。 3?区间估计是在____________ 的基础上,给出总体参数估计的一个区间范围,该区间通常 由样本统计量加减 __________ 得到。 4. ____________ 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为,也成为 ____________ 。 5 ?当样本量给定时,置信区间的宽度随着置信系数的增大而_____________ ;当置信水平固定时,置信区间的宽度随着样本量的增大而 ____________ 。 6. 评价估计量的标准包含无偏性、________ __ 和 _______ __ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可 靠程度,就会 ____________ 置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程 度,就要 ___________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、____________ 和___________ 的影响。 9. ___________________________________________________ 估计方差未知的正态总体均值置信区间用公式__________________________________________ ;当样本容量大于等于30时,可以用近似公式 ____________ 。 10. 估计正态总体方差的置信区间时,用___________ 分布,公式为 __________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C. 一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2. 估计量的含义是指()。 A. 用来估计总体参数的统计量的名称

相关主题