搜档网
当前位置:搜档网 › 高中数学第一章统计1.2抽样方法知识导航

高中数学第一章统计1.2抽样方法知识导航

§2抽样方法

知识梳理

1.简单随机抽样

(1)设一个总体含有N个个体,从中逐个不放回地抽取n个个体为样本(n≤N),如果在抽取过程中,总体内的每个个体被抽到的概率相同,这样的抽样方法就叫做简单随机抽样.

(2)最基本、最常用的简单随机抽样方法有两种,即抽签法和产生随机数的方法.

(3)抽签法的实施步骤可以归结为:①编号;②制签;③搅匀;④抽签;⑤获样.

(4)产生随机数法就是利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生的随机数进行抽样.

(5)简单随机抽样具有简便易操作的优点,在总体容量不大的情况下是行之有效的.

2.分层抽样

(1)当总体中的个体由明显差异的几部分组成时,为了使抽取的样本更好地反映总体的情况,通常采用分层抽样法.

(2)实施分层抽样时,应将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占的比例进行简单随机抽样.

3.系统抽样

(1)当总体容量和样本容量都很大时,不再适宜用简单随机抽样和分层抽样,而系统抽样就可以解决这个问题.

(2)一般地,要从容量为N的总体中抽取容量为n的样本,采用系统抽样可按下列步骤进行:

①编号:(有时可直接使用个体自身所带的号码,如学号、准考证号、门牌号等).

②分段:对编号进行分段,要保证“等距”分段.

③确定起始号码:在第一段用随机抽样的方法确定起始的个体号码.

④按事先指定的规则抽取样本,通常是起始号码分段间隔,依次获取样本.

4.三种抽样方法的比较

(1)三种抽样方法的区别与联系如下表:

类别共同点各自特点相互联系适用范围

简单随机抽样

抽样过程中每个

个体被抽取的可

能性相等从总体中逐个抽

总体中的个体数

较少

系统抽样将总体均分成几

部分,按事先确

定的规则在各部

分抽取

在起始部分抽样

时采用简单随机

抽样的方法抽样

总体中的个体数

较多

分层抽样将总体分成几

层,分层进行抽

各层抽样时采用

简单随机抽样或

系统抽样的方法

进行抽样

总体由差异明显

的几部分组成

(2)简单随机抽样是系统抽样和分层抽样的基础,三种抽样方法的共同特点是:

①都是等可能性抽样;

②被抽取样本的总体的个数有限;

③逐个地进行抽取;

④都是不放回抽样.

知识导学

学习本节前应先复习初中所学的总体、个体、样本、样本容量的概念,并借助于实例了解抽

取样本的必要性和重要性.

学习本节中的三种抽样方法(简单随机抽样、系统抽样、分层抽样)时,应结合生活中的实例去体会它们各自的特点、使用范围和操作步骤.

简单随机抽样(抽签法、产生随机数法)是获取样本最基本的抽样方法,尽管它有局限性(仅适宜总体数较少时),但它却是任何抽样方法的基础,也是不可缺少的方法,所以务必熟记它们的操作方法.

记忆小窍门:抽签法操作要点是:编号、写签、搅匀、抽取.

随机数表法操作要点是:编号、选起始数、读数、获取样本.

系统抽样和分层抽样是在总体中个体数较大和总体中个体具有明显的差异时,采用的抽样方法.

学习过程中,要弄懂系统抽样和分层抽样的适用范围、概念和操作步骤,结合实例理解其中的关键步骤,哪些步骤属于简单随机抽样.初步理解后,要及时结合具体问题,运用系统抽样法和分层抽样法设计抽样方案,完成抽样过程,加以巩固.

记忆小窍门:系统抽样的步骤可概括为:①编号,②定间隔分段,③在第一段内定起始号,④后加间隔得每段号码,获取样本.

当用分层抽样进行抽取样本时,需注意以下几个问题:

(1)必须先判断所考查的总体中的个体是否具有明显的差异,若是则用分层抽样,若不是,应用简单随机抽样或系统抽样.

(2)为获取各层入样数目,需先正确计算出抽样比k =总体容量

样本容量.若k 与某层个体数的积不是整数时,可四舍五入取整.

(3)体会分层抽样仍属于等可能抽样,用分层抽样获取的样本更能很好地代表总体.

疑难突破

1.系统抽样中如何对总体中的每个个体进行合理分段?

剖析:系统抽样操作的要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取1个个体,得到所需样本.由于抽样的间隔相等,因此系统抽样也被称作等距抽样(或叫机械抽样).所以系统抽样中必须对总体中的每个个体进行合理(即等距)分段.

若从容量为N 的总体中抽取容量为n 的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔k ,以便对总体编号进行分段. 当n N 是整数时,取k =n N 为分段间隔即可,如N =100,n =20,则分段间隔k =20

100=5,也就是将100个个体平均分为5段.

特别地,当

n

N 不是整数时,应先从总体中随机剔除一些个体,使剩余个体数N ′能被n 整除,这时分段间隔k =n

N ,如N =101,n =20,则应先在总体中剔除1个个体,使剩余的总体容量(即100)能被20整除,从而得出分段间隔k =20100=5,也就是说,只需将100个个体平均分为5段.

一般地,用简单随机抽样的方法从总体中剔除部分个体,其个数为总体中的个体数除以样本容量所得的余数.

上述过程中,总体中的每个个体被取出(或被剔除)的可能性相等,也就是每个个体不被选取(或不被剔除)的可能性也相等,所以在整个抽样过程中每个个体被抽取的机会仍然都相等,这说明使用系统抽样法抽取样本的过程是公平的.

2.分层抽样中各层入样的个体数应如何确定?

剖析:当已知总体由差异明显的几部分组成时,应将总体分成互不交叉的几部分,然后按照各部分所占的比例,从各部分中独立抽取一定数量的个体,再将各部分抽出的个体合在一起作为样本,这就是分层抽样.其中所分成的每一部分叫层.

由于层与层之间有明显的区别,而层内个体间差异很小,为了使样本更能充分地反映总体的情况,抽取样本时,必须照顾到各个层的个体.所以每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即总体容量

样本容量.这样抽取能使所得到的样本结构与总体结构基本相同,可以提高样本对总体的代表性.

在实际操作时,应先计算出抽样比k =总体容量

样本容量,获得各层入样数的百分比,再按抽样比确定每层需要抽取的个体数.

例如:一批灯泡400只,其中20 W 、40 W 、60 W 的数目分别为200只、150只和50只,现用分层抽样的方法获取一个容量为40的样本,则三种灯泡依次抽取的个数可如下确定: 求出抽样比k =10

140040==总体容量样本容量.则应抽取各种瓦数的灯泡只数分别为 200×101=20,150×101=15,50×10

1=5.

典题精讲

例1 一单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,从中抽取一个容量为20的样本,分别按下述三种方法抽取:

①将160人从1至160编上号,再用白纸做成1~160号的签160个放入箱内拌匀,然后从中抽20个签,与签号相同的20个人被选出.

②将160人从1至160编上号,按编号顺序分成20组,每组8人,1~8号,9~16号,…,先从第一组中用抽签方式抽出k 号,其余组(k +8n )号(n =1,2,…,19)亦被抽到,如此抽取20人. ③按20∶160=1∶8的比例,从业务人员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用随机数法从各类人员中抽取所需,他们合在一起恰好20人.

问:

(1)上述三种方法中,总体、个体、样本分别是什么?

(2)上述三种方法中各自采取何种抽取样本的方法?

思路分析:三种常用抽样方法各具优点,它们之间既有联系又有区别,应注意对三种抽样方法进行比较.

解:(1)这三种抽取方式中,其总体都是该单位160名职工的收入,其个体都是单位各个职工的收入,其样本为所抽取的20名职工的收入.

(2)第一种为简单随机抽样;第二种为系统抽样;第三种为分层抽样.

简单随机抽样的步骤:①将总体中的个体编号;②选定开始的数字;③获取样本号码.

系统抽样的步骤:①确定分组情况和抽样距;②编号;③在第1段中用简单随机抽样确定起始的个体编号;④按照事先研究的规则抽取样本.

分层抽样的步骤:①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.

绿色通道:针对不同的问题,要选择科学实用的抽样方法.

简单随机抽样的方法包括抽签法和产生随机数法,它们主要适用于总体个体数较少的情况.抽签法的一般步骤:①编号;②准备抽签工具;③实施抽签.在抽签前一定要先把号签搅拌均匀,并且每次只能抽一个.抽签法最大的优点是简便易行,但此种方法不宜适用于总体数量较大的对象,一般适用于个体数量较少的对象.产生随机数法的一般步骤:①编号,②定位置,位置是任意的,③读数,要按一定顺序读数,顺序也是任意的,可以自上至下、自下至上、自左至右、自右至左.取数过程中,要把不符合要求的数(超过最大编码)和与前面重复的数去掉. 采用系统抽样时,要严格按其步骤进行.

变式训练1(2006天津河东一模,6)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,要从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个物品型销售点,要从中抽取7个,调查其销售收入和售后服务等情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是( )

A.分层抽样法,系统抽样法

B.分层抽样法,简单随机抽样法

C.系统抽样法,分层抽样法

D.简单随机抽样法,分层抽样法

思路解析:在①中,由于不同地区的产品销售情况差异较大,为了抽样的公平性,应采用分层抽样法.在②中,总体个体差异不大,总体中的个体数量也不大,故适宜用简单随机抽样.故选B.

答案:B

变式训练2在下列问题中,各采用什么抽样方法抽取样本较为合适?

(1)从20台彩电中抽取4台进行质量检验;

(2)科学会堂有32排座位,每排有40个座位(座号为1~40),一次报告会坐满了听众,会后为听取意见留下了第一列的所有32名听众进行座谈;

(3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,今从中抽取一个容量为15的样本.

解:(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法.

(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法进行抽取样本.

(3)所述问题的总体中的个体具有明显差异,即出现了3个阶层,因此适宜用分层抽样法获取样本.

例2 对某单位1 000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:

任职年限人数

5年以下300

5~10年500

10年以上200

试利用上述资料,设计一个样本容量为100的抽样方法.

思路分析:由于调查的项目与职工任职年限有关,而任职年限又分为三个层次,符合分层抽样的要求,故采取分层抽样的方法.

解:进行分层抽样可分为三层,

因为抽取样本容量与总体个体数之比为

10

10001100 , 所以每层应抽取的个体数应为

5年以下:300×

10

1=30(人), 5~10年:500×10

1=50(人), 10年以上:200×101=20(人). 然后再在每层用简单随机抽样的方法进行抽样,将各层抽取的个体合在一起,就是所要抽取的样本.

绿色通道:由于分层抽样充分利用了我们所掌握的信息,使样本具有较好的代表性,而在各层中进行抽样时,大多数情况下采用简单随机抽样,有时也会用到其他方法,这样需根据问题的需要来决定.

分层抽样适用于总体由差异明显的几部分组成的情况.分层抽样时,分层所抽取的个体数等于该层个体总数与抽样比的乘积,抽样比=.总体个体数

抽取样本容量 变式训练1 (2006四川高考卷,5)甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生( )

A.30人,30人,30人

B.30人,45人,15人

C.20人,30人,10人

D.30人,50人,10人

思路解析:甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生30人,45人,15人,选B.

答案:B

变式训练2 (2006山东高考卷,13)某学校共有师生2 400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是_______.

思路解析:抽取教师为160-150=10(人),所以学校教师人数为2 400×160

10=150(人). 答案:150人

例3 某校高三年级共有430名学生,为了对某次考试的数学成绩作质量分析,打算从中抽取40人作样本,请你设计一个系统抽样,抽取上面所需的样本.

思路分析:总体中的每个个体,都必须是等可能地入样,为了实现“等距”入样,且又等可能性,因此,应先剔除30个个体,然后再分段,定起始位置.

解:先用简单随机抽样从总体中剔除30个个体(可用产生随机数法,也可用抽签法),再将剩下的400名学生进行编号:1,2,3,…,400,然后将总体分为40个部分,其中每个部分包括10

个个体,如第1部分的个体编号为1,2,3,…,10,从中随机抽取一个号码,比如6,那么就可以从第6号开始,每隔10个抽取1个,这样得到容量为40的样本:6,16,26,36,…,396. 绿色通道:利用抽签法抽取样本时,编号应从1开始;而利用随机数抽取样本时,编号应从0开始.例如将100个个体编号成00,01,02,…,99,而不是编号成0,1,2,…99,以便于运用随机数表,将起始号码选为00,而不是01,可使100个个体都可用两位数字号码表示,否则将会出现三位数字号码100.利用随机数表产生随机数是最常用的产生随机数的方法,要掌握此种方法的步骤.

当总体容量和样本容量都很大时,采用简单随机抽样或分层抽样,都是非常麻烦的,系统抽样正好能解决这个问题.

用系统抽样抽取一定容量的样本时,首先要分清总体中的个数是否能被样本容量整除,否则就会出现抽样距不等的情况,就不合乎系统抽样的原则,还要注意总体的排列有没有明显的周期性,这时抽样距的选取要恰当,要打乱周期性;如果总体事先排好序,要先打乱顺序,再抽样,以达到抽取的样本具有广泛的代表性.

变式训练 下列抽样试验中,最适宜用系统抽样法的是( )

A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样

B.某厂生产的2 000个电子元件中随机抽取5个入样

C.从某厂生产的2 000个电子元件中随机抽取200个入样

D.从某厂生产的20个电子元件中随机抽取5个入样

思路解析:A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数表法;D 中总体数很小,故适宜用抽签法.只有C 比较符合适用系统抽样法. 故选C.

答案:C

例4 (2006湖北高考卷,17)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的4

1,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:

(1)游泳组中,青年人、中年人、老年人分别所占的比例;

(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.

思路分析:考虑到参加活动的职工差异比较明显,所以应将全体参加活动的职工合理分层,再从各层中按比例抽取入样人数.为此需先计算出青年人、中年人、老年人分别所占的比例. 解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c , 则有%,1043%10·%,5.4743%40·=+=+x

xc x x xb x 解得b =50%,c =10%.

故a =100%-50%-10%=40%,

即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.

(2)游泳组中,抽取的青年人数为200×

43×40%=60(人);抽取的中年人数为200×43×50%=75(人);抽取的老年人数为200×4

3×10%=15(人). 黑色陷阱:解答该题的关键是第(1)问,最容易出现的错误是不能正确运用变量将登山组人数

和青年人、中年人、老年人各占比例数表示出来,必会导致表达混乱,直至出错.其根本原因在于没有正确地阅读和理解题意,找不出解决问题的入手点.合理的解题方案是弄懂题意后,选择登山组人数(设为x )为出发点,进而可表示出参加活动的全体职工数(4x ),那么“在参加活动的职工中,中年人占47.5%,老年人占10%”才能转化为相应的数学表达式,并由此求出游泳组中,青年人、中年人、老年人分别所占的比例.

问题探究

问题1 从总体中抽取样本,再通过对样本的研究估计总体的情况是统计的基本思想.那么,该怎样理解从总体中的这种抽样的思想?请结合实际的例子进行说明.

导思:可从发生在我们大家周围的许多实际问题出发,来理解统计的基本思想.

探究:对于统计的基本思想应作较广义的理解.可以结合实际的例子进行理解.例如,当在同一条件下进行100次抛掷同一硬币的试验,其结果可以看成是,在相同条件下进行很多次这种试验的结果组成的总体中抽取的一个容量为100的样本,从而我们可以利用这个样本的情况去估计总体的情况.能反映统计的基本思想的实际问题还有很多,如彩票、产品检验、电视节目收视率、学生的体重、商品的销售、景点的游客接待等都是通过样本数据来估计总体的情况的.在统计中涉及的抽样方法很多.如果按抽取样本时总体中的每个个体被抽取的可能性是否相等来分,可分为等可能性抽样和不等可能性抽样.而实际的抽样总要考虑公平性问题,所以,我们最常用的是等可能性抽样,也就是在抽样中,每个个体被抽到的可能性是相等的.

问题 2 放回和不放回抽样是两种不同的抽样方法,在实际中要根据问题进行适当选择.请结合抽样的过程,谈谈你对抽样方法中的放回抽样和不放回抽样的理解.

导思:在我们的实际生活中放回和不放回抽样都大量存在着,不妨借助熟悉的例子加以理解.

探究:在实际应用中,多采用不放回抽样,但像抛掷硬币、抛掷骰子等都是放回抽样,放回抽样在理论研究中较为重要.事实上,只有在放回抽样的情况下,才能保证每次抽样的结果作为随机变量所取的一个值都是相互独立且分布相同的.不过在实际应用中这两类抽样的区分有时并非那么严格,特别是当总体中的个体数很多甚至无限时,被抽取的个体是否放回总体对总体分布所造成的影响很小,因此这时的不放回抽样也可看成放回抽样,从而可以运用在放回抽样情况下可以运用的结论.

问题 3 三种随机抽样方法有一个共同特点,即都是等可能抽样,也就是说不仅每次从总体中抽取一个个体时,各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性.那么为什么每个个体被抽到的机会是均等的呢?

导思:大家可以借助于下面的问题理解.

在一个盒子里装有大小、形状完全相同的5个白球和1个黑球,现有6人每人摸球一次,每次摸球一个,摸后不放回,试问6人中每人摸到黑球的机会是否相同?

探究:不妨按甲、乙、丙、丁、戊、己的顺序依次摸球.下面计算他们在摸球顺序不同的情况下摸到黑球的机会是否一样.

甲第一个摸球,摸到黑球的机会是

6

1. 乙第二个摸球,摸到黑球的机会是(1-61)×51=6

1. 丙第三个摸球,摸到黑球的机会是(1-61-61)×41=61.

丁第四个摸球,摸到黑球的机会是(1-6

1-61-61)×31=61. 戊第五个摸球,摸到黑球的机会是(1-6

1-61-61-61)×21=61. 己第六个摸球,摸到黑球的机会是(1-61-61-61-61-61)×11=6

1. 这就是说,6人摸球次序有先有后,但每个人摸到黑球的机会是相等的.

类似的问题还有:

“摸彩票”问题,中奖号码是随机产生的,买彩票有先有后,但每位买彩票的人获奖机会是均等的.

相关主题