壹
高考数学专题八之统计
【知识概要】
一、抽样方法
●1. 简单随机抽样——设一个总体的总数为N ,若通过逐个抽取的方法从总体中抽取一个样本,且每次抽取时,各个个体被抽到的概率相等,这样的抽样方法叫简单随机抽样。
特点:不放回抽样;逐个抽取;被抽取的样本的总数是有限的。 主要方法:抽签法;随机数表法。
●2. 系统抽样——将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法叫简单系统抽样。
特点:等概率抽样;等距离(或按预先定出的规则)抽样;不放回抽样。 系统抽样的步骤:
①采用随机的方式将总体中的个体编号;
②将整个的编号按一定的间隔(设为k ),当N n
(N 为总体中的个体数,n 为
样本容量)是整数时,;N k n
= 当N n
不是整数时,从总体中剔除一些个体,使剩
下的总体中个体的个数1N 能被n 整除,这时1
N k n
=,并将剩下的总体重新编号;
③在第一段中用简单随机抽样确定起始的个体标号l ; ④将编号为,,2,,(1)l l k l k l n k +++-L 的个体抽出。
●3. 分层抽样——当总体由差异明显的几个部分组成时,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这样的抽样方法叫分层抽样。
特点:每层抽取的样本数=?每层的个数所要抽取的总体数总体样本个数
;等概率抽样;
不放回抽样。
分层抽样的步骤:
①将总体按一定标准分层;
②计算各层的个数与总体的个数的比;
③按各层个数占总体的个数的比确定各层应抽取的样本容量; ④在每一层进行抽样(可用简单随机抽样或系统抽样)。 二、总体分布的估计和总体特征数的估计 ●1. 频率分布表的有关概念
(1)频数: 在一组数据中,某范围内的数据出现的次数; (2)频率: 频数除以数据的总个数; (3)全距: 数据中最大与最小值的差;
(4)组距=全距组数
;
(5)分组要求:通常对组内数值所在区间取左开右闭区间,最后一组取闭区间,并且使分点比数据多一位小数。
贰
●2. 频率分布直方图 具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图:
① 横轴表示样本数据,纵轴表示频率与组距的比值;
② 以每个组距为底,以各频率除以组距的商为高,分别画成矩形; ③ 图中每个矩形的面积等于相应组的频率,即:?=频率组距频率组距
;
④ 各组频率的和等于1,即各小矩形的面积的和等于1。
●3. 频率分布折线图:将频率分布直方图中,取各相邻矩形的上底边中点顺次连接,再将矩形的边去掉,就得到频率分布折线图。
●4. 密度曲线:当样本容量取得足够大,分组的组距取得足够小,则这条折线就越接近于一条光滑的曲线,这条光滑的曲线称为总体密度曲线。
●5. 中位数:将数据按从小到大或从大到小排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数。
●6. 众数:在一组数据中出现次数最多的数叫做这组数据的众数;众数不一定是唯一的。
●7. 平均数计算的方法:
(1)简单平均数12n
x x x x n
+++=
L ;
(2)离散型平均数计算:12,,,n x x x L 所发生的频率分别为12,,,n p p p L ,则平均数为
1122n n x p x p x p +++L ;
(3)区间型平均数计算:12231[,),[,),,[,]n n a a a a a a +L 所发生的频率分别为
12,,,n p p p L ,则平均数为
2311212 (222)
n n n a a a a a a P P P +++++++ ●8. 方差:2
211()n
i i s x x n ==-∑
●9.
标准差:s 三、统计案例
叁
●1. 回归分析
回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。对具有相关关系的两个变量进行统计分析的方法叫回归分析。
线性回归方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为
直线型:?y
a bx =+,我们称这个方程为y 对x 的线性回归方程。 (1)设两个具有线性相关的一组数据为:()()()1122,,,,,n n x y x y x y L
则线性回归方程为:?y bx a =+其中1112211n
n n i i i i i i i n n
i i i i n x y x y b n x x =====????
- ???
????=??- ???∑∑∑∑∑,a y bx =- ,x y 分别为12,,,n x x x L ,12,,,n y y y L 的算术平均数。
(2)特点:线性回归方程过点(,)x y ; ●2. 相关系数
对于变量y 与x 的一组观测值,
把()()
n
n
i
i
i i x x y y x y nx y
r ---∑∑叫做变量y 与x 之间的样本相
关系数,简称相关系数,用它衡量两个变量之间的线性相关程度。
相关系数的性质:||r ≤1,且||r 越接近1,相关程度越大;||r 越接近0,相关程度越小。
●3独立性检验
独立性检验是对两种分类变量之间是否有关系进行检验。
① 独立性检验的必要性:2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用
肆
于总体。
③ 独立性检验的步骤
第一步:提出假设检验问题;
第二步:选择检验的指标(卡方检验);
2
2
()()()()()
n ad bc x a b c d a c b d -=
++++(它越小,原假设“H 0:成立的可能性越大”;它越大,备择假设“H 1:成立的可能性越大”。
3.841x > 6.635x >握说两事件有关;如果2 2.706x ≤,没有充分的证据显示两事件有关。 四、计数原理与二项式定理 ●1. 两个原理.
1. 乘法原理、加法原理.
2. 可以有重复元素.......的排列. 从m 个不同元素中,每次取出n 个元素,元素可以重复出现,按照一定的顺序排成一排,那么第一、第二……第n 位上选取元素的方法都是m 个,所以从m 个不同元素中,每次取出n 个元素可重复排列数m ·m ·… m = m n .. 例如:n 件物品放入m 个抽屉中,不限放法,共有多少种不同放法? (解:n m 种) ●2.排列.
1. ⑴对排列定义的理解.
定义:从n 个不同的元素中任取m(m ≤n )个元素,按照一定顺序......排成一列,叫做从n 个不同元素中取出m 个元素的一个排列. ⑵相同排列.
如果;两个排列相同,不仅这两个排列的元素必须完全相同,而且排列的顺序也必须完全相同.
伍
⑶排列数.
从n 个不同元素中取出m (m ≤n )个元素排成一列,称为从n 个不同元素中取出m
个元素的一个排列. 从n 个不同元素中取出m 个元素的一个排列数,用符号m n A 表
示.
⑷排列数公式:
),,()!
(!
)1()1(N m n n m m n n m n n n A m ∈≤-=
+--=Λ 注意:!)!1(!n n n n -+=? 规定0! = 1
111--++=?+=m n
m n m n m m m n m n mA A C A A A 11--=m n m n nA A 规定10
==n n n C C 2. 含有可重元素......
的排列问题. 对含有相同元素求排列个数的方法是:设重集S 有k 个不同元素a 1,a 2,…...a n
其中限重复数为n 1、n 2……n k ,且n = n 1+n 2+……n k , 则S 的排列个数等于
!
!...!!
21k n n n n n =
.
例如:已知数字3、2、2,求其排列个数3!
2!1)!21(=+=n 又例如:数字5、5、5、求其排列个数?其排列个数1!
3!3==n .
●3.组合.
1. ⑴组合:从n 个不同的元素中任取m (m ≤n )个元素并成一组,叫做从n 个不同元素中取出m 个元素的一个组合.
⑵组合数公式:)!
(!!!)1()1(m n m n C m m n n n A
A C m n m m
m n
m
n -=
+--=
=
Λ ⑶两个公式:①;m n n m n C C -= ②m
n m n m n C C C 11+-=+
①从n 个不同元素中取出m 个元素后就剩下n-m 个元素,因此从n 个不同元素中取出 n-m 个元素的方法是一一对应的,因此是一样多的就是说从n 个不同元素中取出n-m 个元素的唯一的一个组合.。(或者从n+1个编号不同的小球中,n 个白球一个红球,任取m 个不同小球其不同选法,分二类,一类是含红球选法有
1
m n 111m n C C C --=?一类是不含红球的选法有m n C )
②根据组合定义与加法原理得;在确定n+1个不同元素中取m 个元素方法时,对于某一元素,只存在取与不取两种可能,如果取这一元素,则需从剩下的n 个元
素中再取m-1个元素,所以有C 1
-m n ,如果不取这一元素,则需从剩余n 个元素中取出m 个元素,所以共有C m n 种,依分类原理有m n m n m n C C C 11+-=+.
⑷排列与组合的联系与区别.
联系:都是从n 个不同元素中取出m 个元素.
陆
区别:前者是“排成一排”,后者是“并成一组”,前者有顺序关系,后者无顺序关系.
⑸①几个常用组合数公式 n
n n n n n C C C 2
210=+++Λλ 1
1
11
11
2115
314201
1112++--++++++-+=+==++=+++=+++k n k n k n k
n m n m m n m m m m m m n n n n n n n n C n C k nC
kC C C C C C C C C C C C ΛΛΛ
②常用的证明组合等式方法例. i. 裂项求和法. 如:
)!
1(1
1)!1(!43!32!21+-
=++++n n n Λ(利用!1)!1(1!1n n n n --=-) ii. 导数法. iii. 数学归纳法. iv. 倒序求和法.
v. 递推法(即用m n m n m n C C C 11+-=+递推)如:4
13353433+=+++n n C C C C C Λ.
vi. 构造二项式. 如:n n n n n n C C C C 222120)()()(=+++Λ
证明:这里构造二项式n n n x x x 2)1()1()1(+=++其中n x 的系数,左边为
2
2120022110)
()()(n n n n n n n n n n n n n n n n C C C C C C C C C C C +++=?++?+?+?--ΛΛ,而右边n
n C 2= ●4.排列、组合综合.
1. I. 排列、组合问题几大解题方法及题型: ①直接法. ②排除法.
③捆绑法:在特定要求的条件下,将几个相关元素当作一个元素来考虑,待整体排好之后再考虑它们“局部”的排列.它主要用于解决“元素相邻问题”,例如,一般地,n 个不同元素排成一列,要求其中某)(n m m ≤个元素必相邻的排列有
m m m n m n A A ?+-+-11个.其中11+-+-m n m n A 是一个“整体排列”
,而m m A 则是“局部排列”. 又例如①有n 个不同座位,A 、B 两个不能相邻,则有排列法种数为-
2n A 2
2
11A A n ?-. ②有n 件不同商品,若其中A 、B 排在一起有2
2
11A A n n ?--. ③有n 件不同商品,若其中有二件要排在一起有11
2--?n n n A A . 注:①③区别在于①是确定的座位,有22A 种;而③的商品地位相同,是从n 件不同商品任取的2个,有不确定性.
④插空法:先把一般元素排列好,然后把待定元素插排在它们之间或两端的空档中,此法主要解决“元素不相邻问题”.
例如:n 个元素全排列,其中m 个元素互不相邻,不同的排法种数为多少?
m
m n m n m n A A 1+---?(插空法)
,当n – m+1≥m, 即m ≤2
1+n 时有意义.
柒
⑤占位法:从元素的特殊性上讲,对问题中的特殊元素应优先排列,然后再排其他一般元素;从位置的特殊性上讲,对问题中的特殊位置应优先考虑,然后再排其他剩余位置.即采用“先特殊后一般”的解题原则.
⑥调序法:当某些元素次序一定时,可用此法.解题方法是:先将n 个元素进行
全排列有n n A 种,)(n m m π个元素的全排列有m
m A 种,由于要求m 个元素次序一定,
因此只能取其中的某一种排法,可以利用除法起到去调序的作用,即若n 个元素排成一列,其中m 个元素次序一定,共有
m m
n n A A 种排列方法.
例如:n 个元素全排列,其中m 个元素顺序不变,共有多少种不同的排法?
解法一:(逐步插空法)(m+1)(m+2)…n = n !/ m !;解法二:(比例分配法)m m n n A A /.
⑦平均法:若把kn 个不同元素平均分成k 组,每组n 个,共有
k k
n
n
n n k n kn A C C C Λ)1(-?.
例如:从1,2,3,4中任取2个元素将其平均分成2组有几种分法?有3!
22
4=C (平
均分组就用不着管组与组之间的顺序问题了)又例如将200名运动员平均分成两组,其中两名种子选手必在一组的概率是多少? (!
2/102022818C C C P =
)
注意:分组与插空综合. 例如:n 个元素全排列,其中某m 个元素互不相邻且顺
序不变,共有多少种排法?有m
m
m m n m n m n A A A /1+---?,当n – m+1 ≥m, 即m ≤2
1+n 时有意义.
⑧隔板法:常用于解正整数解组数的问题.
例如:124321=+++x x x x 的正整数解的组数就可建立组合模型将12个完全相同的球排成一列,在它们之间形成11个空隙中任选三个插入3块摸板,把球分成4个组.每一种方法所得球的数目依次为4321,,,x x x x 显然124321=+++x x x x ,故(4321,,,x x x x )是方程的一组解.反之,方程的任何一组解),,,(4321y y y y ,
对应着惟一的一种在
12个球之间插入隔板的方式(如图所示)故方程的解和插
板的方法一一对应. 即方程的解的组数等于插隔板的方法数3
11C .
注意:若为非负数解的x 个数,即用
n
a a a ,...,21中i a 等于
1
+i x ,有
A a a a A x x x x n n =-+-+-?=+++1...11...21321,进而转化为求
a 的正整数解的个数为1
-+n n A C .
⑨定位问题:从n 个不同元素中每次取出k 个不同元素作排列规定某r 个元素都
包含在内,并且都排在某r 个指定位置则有r
k r n r r A A --.
2
x 4
捌
例如:从n 个不同元素中,每次取出m 个元素的排列,其中某个元素必须固定在(或不固定在)某一位置上,共有多少种排法?
固定在某一位置上:11
--m n A ;不在某一位置上:11---m n m n A A 或11111----?+m n m m n A A A (一类是不取出特殊元素a ,有m n A 1-,一类是取特殊元素a ,有从m-1个位置取一个位置,然后再从n-1个元素中取m-1,这与用插空法解决是一样的)
⑩指定元素排列组合问题.
i. 从n 个不同元素中每次取出k 个不同的元素作排列(或组合),规定某r 个元
素都包含在内 。先C 后A 策略,排列k k r k r n r r A C C --;组合r k r n r r C C --.
ii. 从n 个不同元素中每次取出k 个不同元素作排列(或组合),规定某r 个元
素都不包含在内。先C 后A 策略,排列k k k r n A C -;组合k r n C -.
iii 从n 个不同元素中每次取出k 个不同元素作排列(或组合),规定每个排列(或组合)都只包含某r 个元素中的s 个元素。先C 后A 策略,排列k k s k r n s r A C C --;
组合s k r n s r C C --.
II. 排列组合常见解题策略:
①特殊元素优先安排策略;②合理分类与准确分步策略;③排列、组合混合问题先选后排的策略(处理排列组合综合性问题一般是先选元素,后排列);④正难则反,等价转化策略;⑤相邻问题插空处理策略;⑥不相邻问题插空处理策略;⑦定序问题除法处理策略;⑧分排问题直排处理的策略;⑨“小集团”排列问题中先整体后局部的策略;⑩构造模型的策略. 2. 组合问题中分组问题和分配问题.
①均匀不编号分组:将n 个不同元素分成不编号的m 组,假定其中r 组元素个数相等,不管是否分尽,其分法种数为r r A A /(其中A 为非均匀不编号分组中分法数).如果再有K 组均匀分组应再除以k k
A . 例:10人分成三组,各组元素个数为2、4、4,其分法种数为1575
/224448210=A C C C .若分成六组,各组人数分别为1、1、2、2、2、2,其分法种数为44
222224262819110/A A C C C C C C ? ②非均匀编号分组: n 个不同元素分组,各组元素数目均不相等,且考虑各组间的顺序,其分法种数为m m
A A ? 例:10人分成三组,各组人数分别为2、3、5,去参加不同的劳动,其安排方法
为:33
5538210A C C C ???种. 若从10人中选9人分成三组,人数分别为2、3、4,参加不同的劳动,则安排
方法有33
4538210A C C C ?种
玖
③均匀编号分组:n 个不同元素分成m 组,其中r 组元素个数相同且考虑各组间的顺序,其分法种数为m m
r r A A A ?/. 例:10人分成三组,人数分别为2、4、4,参加三种不同劳动,分法种数为33
22
4
44
82
10A A C C C ? ④非均匀不编号分组:将n 个不同元素分成不编号的m 组,每组元素数目均不相
同,且不考虑各组间顺序,不管是否分尽,其分法种数为1m n C A =21
m m -n C …k m )m ...m (m -n 1-k 21C +++
例:10人分成三组,每组人数分别为2、3、5,其分法种数为25205538210=C C C 若从10人中选出6人分成三组,各组人数分别为1、2、3,其分法种数为126003729110=C C C . ●5.二项式定理.
1. ⑴二项式定理:n
n n r r n r n n n n n
n b a C b a C b a C b a C b a 01100)(+++++=+--ΛΛ. 展开式具有以下特点:
① 项数:共有1+n 项;
② 系数:依次为组合数;,,,,,,210n n r n n n n C C C C C ΛΛ
③ 每一项的次数是一样的,即为n 次,展开式依a 的降幕排列,b 的升幕排列
展开.
⑵二项展开式的通项.
n b a )+(展开式中的第1+r 项为:),0(1Z r n r b a C T r
r n r n r ∈≤≤=-+.
⑶二项式系数的性质.
①在二项展开式中与首未两项“等距离”的两项的二项式系数相等; ②二项展开式的中间项二项式系数.....
最大. I. 当n 是偶数时,中间项是第12
+n
项,它的二项式系数2n
n C 最大; II. 当n 是奇数时,中间项为两项,即第21+n 项和第12
1
++n 项,它们的二项式系
数21
21+-=n n
n n C C
最大.
③系数和:
1
3
1420102
2-=++=+++=+++n n n n n n n
n n n n C C C C C C C C Λ
Λ
Λ
附:一般来说b a by ax n ,()(+为常数)在求系数最大的项或最小的项...........时均可直接根据性质二求解. 当11≠≠b a 或时,一般采用解不等式组
壹拾
111
11(,+-+-+???≤≤??
?≥≥k k k k
k k k k k k T A A A A A A A A A 为或的系数或系数的绝对值)的办法来求解. ⑷如何来求n c b a )(++展开式中含r q p c b a 的系数呢?其中,,,N r q p ∈且n r q p =++把
n n c b a c b a ])[()(++=++视为二项式,先找出含有r C 的项r r n r n C b a C -+)(,另一方面在r n b a -+)(中含有q b 的项为q p q r n q q r n q r n b a C b a C ----=,故在n c b a )(++中含r q p c
b a 的项为
r q p q r n r n c b a C C -.其系数为r
r q p n p n q r n r n C C C p q r n q r n q r n r n r n C C --==---?-=
!
!!!)!(!)!()!(!!. 2. 近似计算的处理方法.
当a 的绝对值与1相比很小且n 不大时,常用近似公式na a n +≈+1)1(,因为这时
展开式的后面部分n
n n
n n a C a C a C +++Λ3322很小,可以忽略不计。类似地,有na a n -≈-1)1(但使用这两个公式时应注意a 的条件,以及对计算精确度的要求.
最全高考数学统计专题解析版【真题】 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN
第十一章统计、统计案例 第一部分六年高考荟萃 2013年高考题 1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取 42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号 落入区间[481, 720]的人数为()A.11 B.12 C.13 D.14 2 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有 50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名 女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名 女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班级男生成绩的平均数小于该班女生成绩的平均数 3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高 一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布 直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60 分的学生人数为()A.588 B.480 C.450 D.120 4 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。利用下 面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 )A.08 B.07 C.02 D.01 5.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是 ___________(结果用最简分数表示)
统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:
s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样
1.【2015·新课标II】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); 价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.【2015·福建】某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率; (Ⅱ)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望.
3.【2015·山东】若n是一个三位正整数,且n的个位数字大于十位数字,十位数字大于百位数字,则称n为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10 分;若能被10整除,得1分. 整除,得1 (I)写出所有个位数字是5的“三位递增数” ; (II)若甲参加活动,求甲得分X的分布列和数学期望EX. 4.【2015·安徽】已知2件次品和3件正品放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束. (Ⅰ)求第一次检测出的是次品且第二次检测出的是正品的概率; (Ⅱ)已知每检测一件产品需要费用100元,设X表示直到检测出2件次品或者检测出3件正品时所 需要的检测费用(单位:元),求X的分布列和均值(数学期望).
§10.2统计及统计案例 考纲解读 分析解读
从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
高考复习专题之:概率与统计 一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值. 1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法 例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c , d , e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通 路的概率是 . 分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意 两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。 解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)= 106=5 3 评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法 例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如, 两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明 的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少? 分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。 解:画树状图如图树状图。由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)= 31 点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法 例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率. 分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数
专题10.2 统计与统计案例 一、填空题:请把答案直接填写在答题卡相应的位置........ 上(共10题,每小题6分,共计60分). 1.交通部门对某路段公路上行驶的汽车速度实施监控,从速度在 的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在 以下的汽车有辆. ) 【答案】75 2.某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 ▲ . 【答案】17 【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人 3.若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为▲. 【答案】2 【解析】由题意得,因此方差为 4.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为的样本,已知从男学生中抽取的人数为100人,那么 ▲ . 【答案】200 【解析】男学生占全校总人数,那么 5.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示。若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为.
【答案】20 【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4, ∴该班学生中能报A专业的人数为50×0.4=20. 6.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人. 【答案】37,20 7.下图是2014年在怀化市举行的演讲比赛,七位评委为第一位演讲者打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为. 【答案】, 【解析】去掉一个最高分和一个最低分之后,剩余的五个数据依次是、、、、,平均数为
高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为() A.1%B.2%C.3%D.5% C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食 品开支的30 = 1 , 30+40+100+80+ 50 10 1 ∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.] 2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为() A.4B. 3C.2D.1 B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.] 3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频