9.2.4总体离散程度的估计
知识点一一组数据的方差与标准差
知识点二总体方差与总体标准差
知识点三 样本方差与样本标准差
知识点四 标准差、方差描述数据的特征
标准差刻画了数据的□
01离散程度或□02波动幅度,标准差越大,数据的离散程度□
03越大;标准差越小,数据的离散程度□04越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
知识点五 分层随机抽样估计总体方差
设层数为2层的分层随机抽样,第1层和第2层包含的样本变量由x 1,x 2,…,x n 及y 1,y 2,…,y n 表示.
样本数 总体数 方差 平均数 第1层 m M s 2x x -
第2层 n
N
s 2y
y -
则总体方差s 2=M [s 2x +(x --z -)2]+N [s 2y
+(y --z -)2
]M +N
1.方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x -2],或写成s 2=1n (x 2
1+x 22+…+x 2n )-x -2.即方差等于原数据平方的平均数减去平均数的平方.
2.平均数、方差公式的推广
(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a .
(2)若数据x 1,x 2,…,x n 的方差为s 2,那么 ①数据x 1+a ,x 2+a ,…,x n +a 的方差也是s 2; ②数据ax 1,ax 2,…,ax n 的方差是a 2s 2.
1.判一判(正确的打“√”,错误的打“×”) (1)方差越大,数据的稳定性越强.( )
(2)在两组数据中,平均值较大的一组方差较大.( )
(3)样本的平均数和标准差一起反映总体数据的取值信息.一般地,绝大部分数据落在[x --2s ,x -+2s ]内.( )
(4)平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小.( ) 答案 (1)× (2)× (3)√ (4)√ 2.做一做
(1)下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差
C .若一组数据的值大小相等,没有波动变化,则标准差为0
D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
(2)某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4.
则:①平均命中环数为________; ②命中环数的标准差为________.
(3)样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则该样本的方差为________.
答案 (1)D (2)①7 ②2 (3)2
题型一 样本的标准差与方差的求法
例1 从甲、乙两种玉米中各抽10株,分别测得它们的株高如下: 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40; 试计算甲、乙两组数据的方差和标准差.
[解] x -
甲=110×(25+41+40+37+22+14+19+39+21+42)=30, s 2甲=
110
×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2
+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2,
s 甲=104.2≈10.208.
x -
乙=110×(27+16+44+27+44+16+40+40+16+40)=31, 同理s 2乙=128.8, s 乙=128.8≈11.349.
对标准差与方差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能放大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
某班40名学生平均分成两组,两组学生某次考试成绩情况如下表所示:
求这次考试成绩的平均数和标准差.
? ?????注:标准差s = 1n [(x 1-x -)2+…+(x n -x -)2
]= 1n
[(x 21+x 22+…+x 2
n )-n x -2] 解 设第一组数据为x 1,x 2,…,x 20,第二组数据为x 21,x 22,…,x 40,全班平均成绩为x -.
根据题意,有x -
=90×20+80×2040=85,
42
=120(x 21+x 22+…+x 2
20-20×902),
62
=120(x 221+x 222+…+x 240-20×802),
∴x 21+x 22+…+x 240=20×(42+62+902+802)=291040.
再由变形公式,得s 2=140(x 21+x 22+…+x 240-40x -2)
=140(x 21+x 22+…+x 240
-40×852)=140×(291040-289000)=51, ∴s =51.
题型二 样本标准差、方差的实际应用
例2 某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:
甲:95 82 88 81 93 79 84 78 乙:83 92 80 95 90 80 85 75 (1)试比较哪个工人的成绩较好;
(2)甲、乙成绩位于x --s 与x -+s 之间有多少?
[解] (1)x -甲=18×(95+82+88+81+93+79+84+78)=85, x -乙=18×(83+92+80+95+90+80+85+75)=85.
s 2甲=18×[(95-85)2+(82-85)2+(88-85)2+(81-85)2+(93-85)2+(79-85)2
+(84-85)2+(78-85)2]=35.5,
s 2乙=18×[(83-85)2+(92-85)2+(80-85)2+(95-85)2+(90-85)2+(80-85)2+(85-85)2+(75-85)2]=41.
∵x -甲=x -乙,s 2甲
∴甲的成绩较稳定. 综上可知,甲的成绩较好. (2)∵s 甲=
s 2甲=35.5≈5.96,
x -甲-s 甲=79.04,x -
甲+s 甲=90.96, ∴甲位于[x --s ,x -+s ]之间的数据有4个. 又s 乙=
s 2乙=41≈6.4,
x -
乙-s 乙=78.6,x -乙+s 乙=91.4,
∴乙的成绩位于[x --s ,x -+s ]之间的有5个.
比较两组数据的异同点,一般情况是从平均数及标准差这两个方面考虑.其中标准差与样本数据单位一样,比方差更直观地刻画出与平均数的平均距离.
从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:
甲 8 9 7 9 7 6 10 10 8 6 乙 10
9
8
6
8
7
9
7
8
8
(1)计算甲、乙两人射箭命中环数的平均数和标准差; (2)比较两个人的成绩,然后决定选择哪名学生参加射箭比赛. 解 (1)根据题中所给数据,可得甲的平均数为 x -
甲=110×(8+9+7+9+7+6+10+10+8+6)=8,
乙的平均数为x -
乙=110×(10+9+8+6+8+7+9+7+8+8)=8, 甲的标准差为 s 甲=
110×[(8-8)2+(9-8)2+…+(6-8)2
]=2,
乙的标准差为 s 乙=
110×[(10-8)2+(9-8)2+…+(8-8)2]=305,
故甲的平均数为8,标准差为2,乙的平均数为8,标准差为30
5. (2)∵x -甲=x -乙,且s 甲>s 乙,∴乙的成绩较为稳定,故选择乙参加射箭比赛. 题型三 标准差、方差的图形分析
例3 样本数为9的四组数据,他们的平均数都是5,条形图如下图所示,则标准差最大的一组是( )
A .第一组
B .第二组
C .第三组
D .第四组
[解析] 第一组中,样本数据都为5,数据没有波动幅度,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为
6
3
;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为25
3;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为22,故标准差最大的一组是第四组.
[答案] D
由图形分析标准差、方差的大小
从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性
都比较小,而第四组数据的波动性相对较大,利用标准差的意义也可以直观得到答案.
甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
答案 C
解析由题图可得,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9,所以甲、乙的成绩的平均数均是6,故A不正确;甲、乙成绩的中位数分别为6,5,故B不正确;甲、乙成绩的极差都是4,故D不正确;甲的成绩的方差为1
2×2+12×2)
5×(2
=2,乙的成绩的方差为1
2×3+32)=2.4.故C正确.
5×(1
1.下列选项中,能反映一组数据的离散程度的是()
A.平均数B.中位数
C.方差D.众数
答案 C
解析由方差的定义,知方差反映了一组数据的离散程度.
2.样本数据2,4,6,8,10的标准差为()
A.40 B.8
C .210
D .2 2
答案 D
解析 x -=1
5×(2+4+6+8+10)=6,则标准差为
15
×[(2-6)2+(4-6)2+(6-6)2+(8-6)2+(10-6)2
]=2 2. 3.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
若要从这四人中选择一人去参加该运动会射击项目比赛,最佳人选是________.(填“甲”“乙”“丙”“丁”中的一个)
答案 丙
解析 分析题中表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.
4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 答案 0.1
解析 这组数据的平均数
x -=4.7+4.8+5.1+5.4+5.55=5.1,
则方差s 2=
(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2
5
=0.16+0.09+0+0.09+0.165
=0.1.
5.甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103 乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x -
甲=16×(99+100+98+100+100+103)=100, x -
乙=16×(99+100+102+99+100+100)=100.
s 2甲
=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2
+(103-100)2]=7
3,
s 2乙
=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2
+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均数相同,
又s 2甲>s 2
乙,所以乙机床加工零件的质量更稳定.