搜档网
当前位置:搜档网 › spss快速应用

spss快速应用

spss快速应用
spss快速应用

第二章数据文件的建立

一、SPSS基础知识

㈠SPSS的常用名词和术语

1. 常数(constant)在运行中保持不变的数据。如 、e等。

2. 变量(variable)变化数据的代表。

SPSS对变量有如下规定:

⑴变量名最多由8个字符组成(12.0以前版本),首字符必须为字母或@, 其后可以是字母、数字、下划线、句点、$,#,但不允许把句点(.)作为变量名的尾字符。10.0版本以上可以取汉字变量名;12.0版本开始支持长文件名,允许最长64个字符,但单词之间不允许以空格分隔。

⑵变量有数值型与字符型。SPSS提供的8种类型中,前七种均视为数值型。具体参见教材第12页表2.4。

⑶变量名不区分大小写字母。

⑷变量名不能使用SPSS的关键字。有:AND、OR、NOT、ALL、TO、BY、EQ、GE、GT、LE、LT、NE、WITH。

⑸变量名必须唯一,不允许重复。

3. 表达式(expression)用运算符和括号把常数、变量和函数按一定的规则连接起来的有意义的式子。如:COMPUTE y=sin(x).COMPUTE x=x+1.SPSS用** 代表乘方运算符。

4. 关键字(keywords)SPSS定义的用于标识命令、子命令、函数、运算符和其它设定的特殊词汇。

5. 样品(case)是组成数据文件的基本单元。又称记录(record)或观测(observation )。

6. 缺失值(missing value)指统计中不合格项(因缺失或遗漏)或给出规定值以外的数值。SPSS有系统缺失值和用户缺失值两种。SPSS用句点(.)代表缺失值。

㈡SPSS的常用函数

二、SPSS数据录入和数据获取

㈠SPSS数据录入

在SPSS中可以采取先定义变量后录入数据和直接输入数据后修改变量两种方式建立数据文件。

1. 按部就班式

①定义变量。即在变量编辑窗口(V ariable View)定义变量的十大属性Name、Type、Width、Decimals、Label、Values、Missing、Columns、Align、Measure。

参见例2.1的数据文件exp2.1.sav的变量编辑窗口。

②输入数据。即在数据编辑窗口(Data View)录入原始数据。一列为一个变量,一行为一个记录。

参见例2.1的数据文件exp2.1.sav的数据编辑窗口。

2. 先斩后奏式

①输入数据。SPSS默认从var00001、var00002 、…、开始自动启变量名。

②修改变量。

SPSS的数据文件经存储后,其默认的文件名后缀为: “.sav” 。SPSS的数据文件还可以存成其它类型的数据文件,如Excel(*.xls)、dBASE(*.dbf)等。

★㈡SPSS数据获取

SPSS可以调入由其它软件生成的数据文件。如常用的Excel、dBASE等数据库文件。

方法:File →Open →Data…,在打开的Open File对话框中打开“文件类型”下拉框,选择外部数据文件相应的文件类型,再找到文件的相应存储位置,即可找到并调入该数据文件。

SPSS可打开的数据文件类型参见图2.8a。

SPSS可以存储多达22种格式的数据文件(12.0以上版本)。SPSS可存储的数据文件类型参见图2.8b。

思考题

1. 变量的标签(variable labels)和变量值标签(value label)的区别。

2. 变量宽度(Width)和变量显示宽度(Columns)的区别。

3. 系统缺失值和用户缺失值的区别。

第三章数据文件的编辑

一、数据的搜索

1. 搜索指定记录的序号

Data →Go to case…,键入序号。这里的序号是指SPSS自动生成的记录编号。

2. 搜索指定变量中的指定数据

先点击指定变量所在列的任一单元格, Edit →Find…,键入指定数据值。

二、变量和记录的插入与删除

1. 插入变量

⑴在Data View窗口,点击插入变量的位置列,Data →Insert Variable,原变量右移。

⑵在Variable View窗口,点击插入变量的位置行,Data →Insert Variable,原变量下移。

2. 删除变量

⑴在Data View窗口,点击要删变量的名称栏,Edit →Clear。

⑵在Variable View窗口,点击要删变量的序号栏,Edit →Clear。

3. 插入记录

在Data View窗口,点击插入记录的位置行,Data →Insert case,原记录下移。

4. 删除记录

在Data View窗口,点击要删记录的序号栏,Edit →Clear。

★三、数据的重新编码

根据统计分析的需要,当将连续变量转换为分组资料或离散资料时,SPSS常用Recode命令或Visual Bander命令( 12.0以上版本)完成此任务。

1. Recode命令的用法

例2.1中的月龄age最小值1,最大值144。现以20个月为间隔分“1~20”、“21~40”、“41~60”、“61~80”、“81~ 100”、“101~120”、“121~140”、“141~” 8个组。

方法:Transform →Recode →

①Into Same Variables… 重编码后覆盖原变量

②Into Different Variables… 重编码后生成新变量

分别点击Old and New V alues…按钮可打开两个几乎相同的对话框。通过不同的范围定义来生成新的变量值。

SPSS可用于定义范围的主要方式有:

①下限值through 上限值

②Lowest through 上限值

③下限值through highest

注意:为避免重复或遗漏,不论是上限值、下限值、最小值和最大值,凡是第一次出现,SPSS均包含,下次出现相同的值则不包含;范围定义出现重叠,以第一次定义为准。

本例若选择生成一新变量age1,其新旧变量值重新编码的对话框见图3.5。

2. Visual Bander命令的用法

Visual Bander命令是SPSS 12.0开始增加的一个可视化分组的过程,采用图形化操作,非常

直观。

方法:Transform →Visual Bander …→Visual Bander对话框1→Visual Bander对话框2 ,点击Make Cutpoints…按钮打开对话框,定义第一切点(First Cutpoint),组距(Width)

和切点数(Number of),完成填写数据后Apply返回Visual Bander对话框2 , 若定义每组标号则点击Make Labels按钮,

SPSS将根据Make Cutpoints…中定义值自动生成标号, 后在Banded Name填充栏里填写新变量名称,OK完成。

注意:在Make Cutpoints…对话框中, First Cutpoint、Number of和Width三个值的定义中,任意定义完成其中两个值,SPSS则会自动生成第三个值。

本例若选择生成一新变量age1,用Visual Bander命令完成的操作步骤见视频。

四、利用SPSS函数建立新变量

根据统计分析的需要,SPSS可以使用表达式生成新变量,可利用SPSS的函数、运算操作符、数字、逻辑运算符和原有变量,还可利用条件语句If。

SPSS主要通过Transform →Compute…命令完成新变量的建立。下面通过把例2.1中的“手术时间”变量time(单位为分钟)转化成小时来生成一个新变量timehr,并且要求只转换男性病例的过程讲解SPSS建立新变量的过程。

方法:Transform →Compute… →Compute Variable对话框,利用对话框提供的功能完成表达式timehr=time/60的建立,然后点击条件语句If按钮,打开Compute Variable: If Cases对话框,完成条件选择sex=1,点击Continue按钮,再点击OK按钮完成。

五、排序

SPSS主要通过Data →Sort Cases…命令完成对某变量的排序。具体方法参见教材第29页第六节相关内容。

六、数据文件的拆分与合并

1. 数据文件的拆分

SPSS主要通过Data →Select Cases…命令或Split File…命令完成对数据文件的拆分。

⑴物理拆分Data →Select Cases…→Select Cases对话框

若点击条件语句If按钮,打开Select Cases: If 对话框,完成条件选择。

注意:在Select Cases对话框中的Unselected Cases Are选项中,若选择Deleted,则不满足条件的记录将被永久删除且不可恢复;而选择Filtered,则不满足条件的记录只是被屏蔽(即打斜杠),可恢复。Filtered为SPSS默认选项。

⑵形式拆分Data →Split File … →Split File 对话框,从左侧数据库变量列表中选择分组变量,移动到Groups Based on选项框里,OK即可。

注意:形式拆分后只对数据库进行按被拆分变量的排序,只有在实施统计分析命令时方才发生效应。即Split File …命令是一个“冷命令”,只有在执行“热命令”时产生作用。SPSS的Weight Cases…命令也是一个“冷命令”。

以下是对例2.1按“性别变量”(sex)进行形式拆分,分别

选择Compare groups和Organize output by groups项,然后调用统计分析Frequencies命令对“感染与否变量”(infect)进行分析得到的结果1和结果2。

2. 数据文件的合并

SPSS主要通过Data →Merge Files 命令完成对数据文件的合并。

具体方法参见教材第42页“二、数据文件的合并”部分相关内容。

思考题

1. 物理拆分( Select Cases )和形式拆分( Split File )的区别。

2. 本教材中“热命令”和“冷命令”的含义。

第四章清理数据(自学)

一、异常数据的检查和清理

㈠利用Frequencies命令

此命令主要针对分类变量或离散变量,通过选择√ Display frequency tables(列频数表)来发现异常数据的有无。

通过Edit→Find…命令或Data→Select Cases…命令查找异常数据所在的记录,修改或删除。㈡利用Explore命令

此命令主要针对定量变量或连续变量,通过选择√ Outliers(异常点)来发现异常数据的有无,也可通过其输出的Stem-and-Leaf Plot(茎-叶图)或Boxplot(箱图)来直观发现异常数据的有无。

通过Edit→Find…命令或Data→Select Cases…命令查找异常数据所在的记录,修改或删除。

二、相关变量之间的逻辑检查和清理

?具体方法参见教材第54页第二节相关内容。

第五章基本描述统计

一、正态性检验

㈠原始资料

SPSS主要通过Analyze →Nonparametric Tests 4→

1-Sample K-S…检验(即One-Sample Kolmogorov-Smirnov Test)完成对某变量所有数据的正态性检验。

下面通过对教材第58页例5.1的数据做正态性检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp5.1.sav)

2. 正态性检验

Analyze →Nonparametric Tests 4→1-Sample K-S…打开One-Sample Kolmogorov-Smirnov Test对话框。选择检验变量并选择√ Normal(正态分布)选项,OK完成。

3. 结果判读

输出结果见表5.2,若Asymp. Sig. (2-tailed)的值大于检验水准(0.05),则该变量服从正态分布;反之不服从。

注意:在One-Sample Kolmogorov-Smirnov Test对话框中的Exact…按钮,一般当被检验变量的例数小于30时,点击可选择精确检验方法来得到精确检验概率。

SPSS还可以通过Analyze →Descriptive Statistics 4→Explore…分析方法(即探索性分析)完成对某变量所有数据的正态性检验。

下面通过对教材第59页例5.2的数据做正态性检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp5.

2.sav)

2. 正态性检验

Analyze →Descriptive Statistics 4→Explore…打开Explore…对话框,选择检验变量并点击Plots…按钮打开Explore: Plots对话框, 选择√Normality plots with tests选项, 点击Continue按钮,再点击OK按钮完成。

3. 结果判读

输出结果见表 5.4a。本例数据经Lilliefors检验水准下的Kolmogorov-Smirnov检验和Shapiro-Wilk检验,检验概率P均小于0.001,则不服从正态分布。

注意:当样本含量≤50时,选择Shapiro-Wilk检验结果为准。

㈡频数表资料

方法同上。只需把频数表的组中值当成变量值x,把频数 f 用SPSS的加权命令Weight cases 选上, 其余操作步骤同上。参见教材第61页“二、频数表资料的正态性检验”内容。

★二、基本描述统计

㈠使用Frequencies命令

SPSS可以使用Frequencies命令完成对连续变量数据的频数分布分析,可以绘制直方图(histogram);对离散变量进行频数列表并绘制直条图(Bar chart)或饼图( Pie chart );对数据可以求均数、标准差、最大值、最小值、标准误、中位数和百分位数等。

方法:Analyze →Descriptive Statistics 4→Frequencies …

打开Frequencies对话框, 首先选择分析变量, 选择√Display frequency tables选项则输出变量的频数表。点击Statistics…按钮打开Frequencies: Statistics对话框,里面有百分位数值、

集中趋势、离散趋势以及分布四类的指标,每个指标的具体含义参见教材第63页“一、使用Frequencies作基本统计分析”内相关内容;点击Charts…按钮打开Frequencies: Charts对话框,可选择绘制条图、饼图或直方图。

例5.4 对例5.1的数据作基本统计分析。

1. 打开数据文件(见exp5.1.sav)

2. 选择分析变量和基本统计分析项

Analyze →Descriptive Statistics 4→Frequencies …打开Frequencies对话框,选择检验变量男性红细胞量blood并点击Statistics …按钮打开Frequencies: Statistics对话框,选择Mean、Sum、Std.deviation、Minimum、Maximum和S.E.mean,点击Continue按钮,点击Charts…按钮打开Frequencies: Charts对话框,选择Histograms并选择√ With normal curve选项, 点击Continue按钮,再点击OK按钮完成。

3. 结果判读:输出结果见表5.7和图5.9,从图5.9 可见该变量基本服从正态分布。

例5.5 对例5.3的数据作基本统计描述。操作步骤见教材第66 ~ 68页内容。

㈡使用Descriptives命令

SPSS可以使用Descriptives命令完成对连续变量数据的基本描述统计量的计算,与Frequencies命令相比,除不提供中位数、众数(Mode)、百分位数的计算和统计图的输出外,其余功能相同。

方法:Analyze →Descriptive Statistics 4→Descriptives …打开Descriptives对话框, 首先选择分析变量, 点击Options…按钮打开Descriptives : Options对话框,里面有各种基本描述统计量供选择,每个统计量的具体含义参见教材第64 ~65页内相关内容。即使不点击Options…按钮,SPSS默认选择Mean、Std.deviation、Minimum、Maximum四个统计量进行计算。

对例2.1的数据中的月龄变量(age)和红细胞压积变量(hct)作基本描述统计分析。1. 打开数据文件(见exp2.1.sav)2. 选择分析变量和基本描述统计分析项(略)

3. 结果判读:输出结果见表5.9。

思考题

1. Frequencies命令和Descriptives命令的区别。

2. SPSS对数据进行正态性检验的方法有几种?

3. 在用Frequencies命令对连续型变量进行分析时,为什么常常应不选Display frequency tables项?

第六章t检验

一、配对t检验

㈠使用Paired-Samples T Test命令

SPSS主要通过Analyze →Compare Means 4→Paired-Samples T Test…检验完成对某资料的配对t 检验。

注意:SPSS的配对t 检验要求资料建立配对的两个变量数据。

㈡例题及分析过程

下面通过对教材第70页例6.1的数据做配对t 检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp6.1.sav)

2. 适用条件判断

利用前述的正态性检验方法对样本数据进行正态性检验。Analyze →Descriptive Statistics 4→Explore…打开Explore对话框。选择配对的两个变量的差值作为检验变量,并选择Plots…按钮中的√ Normality plots with tests选项, 点击Continue按钮,再点击OK按钮完成。从输出结果表6.2中可以判断出本例治疗前与治疗后的血红蛋白含量差值数据服从正态分布。3. 配对t 检验

Analyze →Compare Means 4→Paired-Samples T

Test…打开Paired-Samples T Test对话框,点击两个变量形成配对变量并移入Paired Variables:列表栏里, OK完成。

4. 结果判读

输出结果见表6.3~6.5,在表6.5中可以得到配对t 检验的统计量t 值为-0.364,检验概率P 为Sig. (2-tailed)的值,即P=0.722>0.05,则无统计学意义,即还不能认为该药能引起患者的血红蛋白含量的显著变化。

二、两组独立样本的t检验

㈠使用Independent-Samples T Test命令

SPSS主要通过Analyze →Compare Means 4→Independent-Samples T Test…检验完成对某资料的两组独立样本的t 检验。

注意:SPSS的两组独立样本的t 检验要求资料建立分组变量。

㈡例题及分析过程

下面通过对教材第75页例6.2的数据做两组独立样本的t 检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp6.

2.sav)

2. 适用条件判断

利用前述的SPSS的数据文件的形式拆分命令Split File把数据文件中的分组变量(group)设置成分组比较变量,从而使得正态性检验方法可以对分组样本数据进行正态性检验(即一箭双雕)。

Data →Split File … →Split File 对话框,点击选择Compare groups选项,再从左侧数据库变量列表中选择分组变量(group),移动到Groups Based on选项框里,OK即可。Analyze →Descriptive Statistics 4→Explore…打开

Explore…对话框,选择血磷值变量(xl)作为检验变量,点击Plots…按钮打开Explore: Plots 对话框, 选择√ Normality plots with tests选项, →Continue →OK完成。

从输出结果表6.7中可以判断出本例急性克山病组与健康组的血磷测定值数据均服从正态分布。

3. 两组独立样本的t 检验

Analyze →Compare Means 4→Independent–SamplesT Test…打开Independent -Samples T Test 对话框,选择分析变量和分组变量, 点击Define Groups…按钮打开Define Groups对话框输入分组标志值,→Continue →OK完成。

4. 结果判读

输出结果见表6.8~6.9,表6.8显示的是每组血磷值的描述统计分析结果;在表6.9中同时显示方差齐性检验结果和t 检验结果。

首先通过Levene…s test for equality of variances(即Levene方差齐性检验)结果判断此数据的

方差齐性结果,本例F 值为0.072,P=0.791>0.05,则方差齐。

然后在Equal variances assumed(即等方差假设)一行找出t 检验结果。本例t= 2.576,P=0.017<0.05,则有统计学意义,即认为急性克山病患者与健康人的血磷测定值(总体)不同。

?第七章方差分析

一、单因素方差分析

㈠使用One-Way ANOV A命令

SPSS通过Analyze →Compare Means 4→One-Way ANOV A…检验完成对某资料的单因素方差分析。

注意:SPSS的方差分析都要求资料建立分组变量。

㈡例题及分析过程

下面通过对教材第81页例7.1的数据做单因素方差分析来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp7.1.sav)

2. 适用条件判断

仿前述分组进行正态性检验方法可以得到每组样本数据的正态性检验结果(即一箭三雕)。具体过程略。

本例用Shapiro-Wilk检验得到group=1的P=0.600, group=2的P=0.074,group=3的P=0.221,三组数据均服从正态分布。

3. 单因素方差分析

Analyze →Compare Means 4→One-Way ANOV A…打开One-Way ANOV A对话框, 选择分析变量和分组变量,

点击Options…按钮,打开One-Way ANOV A: Options对话框选择√ Homogeneity of variance test (方差齐性检验)选项,

→Continue →OK完成。

4. 结果判读

输出结果见表7.4~7.5,在表7.4中显示的是方差齐性检验的结果。本例P=0.053,P>0.05,则方差齐。

表7.5显示的是方差分析的结果。本例F = 5.564,P= 0.008<0.05,即认为三组大鼠肾组织液中NO水平存在着不同。

二、方差分析中均数的两两比较

当方差分析结论拒绝H0时,得到的多组样本的总体均数不同只是笼统的,而研究者往往需要知道多个均数间到底哪些存在不同,这就需要借助多重比较(Multiple Comparisons)的方法。

SPSS提供了多达18种的多重比较方法,我们这里只介绍常用的S-N-K法、LSD法、Dunnett 法和Bonfferoni法。

⑴S-N-K法(Student-Newman-Keuls):又称q检验。常用于多个均数间每两个均数的比较。

⑵LSD法(Least Significant Difference):即最小显著差法。常用于多个处理组与对照组的均数比较。

⑶Dunnett法:常用于多个处理组与对照组的均数比较。

⑷Bonfferoni法:常用于多个均数间每两个均数的比较。

㈠使用Post Hoc…按钮

SPSS通过Analyze →Compare Means 4→One-Way ANOV A…打开One-Way ANOV A对话框并点击Post Hoc…按钮打开One-Way ANOV A: Post Hoc Multiple Comparisons对话框来选

择使用某种多重比较方法。

㈡例题及分析过程

下面通过对教材第85页例7.2的数据做多重比较来讲述操作步骤及结果的判读。

1. 打开数据文件(见exp7.

2.sav)

2. 选用多重比较方法

Analyze →Compare Means 4→One-Way ANOV A…打开One-Way ANOV A对话框并点击Post Hoc…按钮打开One-Way ANOV A: Post Hoc Multiple Comparisons对话框,分别选择√LSD、√ S-N-K、√ Bonfferoni和√ Dunnett选项,Continue →OK完成。

3. 结果判读

输出结果见表7.6~7.7,表7.6显示的是S-N-K法的分析结果;表7.7显示的是LSD法、Bonfferoni法和Dunnett法的分析结果。

S-N-K法是通过寻找同质子集(Homogeneous Subsets)的方法得出比较结果。子集之间的各组间有差别(P<0.05),子集之内的各组间无差别(P>0.05)。

LSD法、Bonfferoni法和Dunnett法是通过在对比的两组均数差值(Mean Difference (I-J))的右上角标记“ * ”来表示此两组均数有差别(P<0.05),未标的则无差别(P>0.05)。

本例用上述四种多重比较方法得到的两两比较结果见下表7.6-7。

表7.6-7 四种多重比较方法得到的结果

对比组LSD Bonfferoni Dunnett S-N-K

正常对照组与肾缺血60min组P >

0.05

P > 0.05 P > 0.05

P >

0.05

正常对照组与肾缺血60min再灌流组P <

0.05

P < 0.05 P < 0.05

P <

0.05

肾缺血60min组与肾缺血60min再灌流组P <

0.05

P < 0.05 —

P <

0.05

三、随机区组设计的方差分析(自学)

㈠使用Univariate命令

SPSS通过Analyze →General Linear Model 4→Univariate …命令完成随机区组设计的方差分析。

㈡例题及分析过程

下面通过对教材第87页例7.3的资料做随机区组设计的方差分析来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp7.3.sav)

2. 适用条件判断:具体过程略。

3. 随机区组设计的方差分析

Analyze →General Linear Model 4→Univariate …打开Univariate对话框,将尿氟排出量变量(nf)调入Dependent Variable (因变量) 中,将时间变量(group)、区组变量(block)调入Fixed Factor(s)(固定因素)中,点击Model…按钮打开Univariate: Model对话框, 选择Custom (自定义)选项,再点击Build Term(s)下的下拉框并从中选择Main Effects,然后把左侧的group、block调入右侧的Model栏,去掉栏下的Include intercept in model选项, →Continue →OK完成。

4. 结果判读

输出结果见表7.10a,结果显示:group组(不同时间):F=7.033, P=0.004 < 0.05 ,即

工前、工中和工后的氟作业工人尿氟排出量存在不同。

block组(不同区组):F=1.642, P=0.155 > 0.05,即工人之间的差异对尿氟排出量影响不大。

5. 多重比较

Analyze →General Linear Model 4→Univariate …打开Univariate对话框, 点击Post Hoc…按钮打开Univariate:

Post Hoc Multiple Comparisons for Observed Means对话框,

选择group为多重比较变量, 再分别选择√ LSD、√ S-N-K、√ Bonfferoni和√ Dunnett选项,Continue →OK完成。

输出结果见表7.12和表7.13。用上述四种多重比较方法得到的两两比较结果见下表7.12-13。

表7.12-13 四种多重比较方法得到的结果

对比组LSD Bonfferoni Dunnett S-N-K 工前组与工中组P < 0.05 P < 0.05 P < 0.05 P < 0.05

工前组与工后组P > 0.05 P > 0.05 P > 0.05 P > 0.05

工中组与工后组P > 0.05 P > 0.05 —P > 0.05

教材第93页例7.4的资料做随机区组设计的方差分析的操作步骤及结果的判读(自学)。

* 四、多因素方差分析

前面讲授的随机区组设计的方差分析实质就是一个最简单的多因素方差分析(两因素无重复数据),因为它不存在交互效应(interaction),当某因素的各单独效应随另一因素变化而变化时,则称这两个因素存在交互效应。

由于从总变异中分解的变异项目增多,多因素方差分析计算和输出结果就更为复杂。本节内容略。

*五、析因分析(有重复的两因素方差分析)

析因分析实质就是有重复数据的两因素方差分析。它可以存在单独效应(Simple effect)、主效应(main effect)和交互效应(interaction)。

SPSS通过Analyze →General Linear Model 4→Univariate …命令完成析因分析。

下面通过对《卫生统计学》第5版教材第157页例9-3的资料做析因分析来讲述操作步骤及结果的判读。

1. 建立数据文件(见wstjx5exp9-3.sav)

2. 析因分析

Analyze →General Linear Model 4→Univariate …打开Univariate对话框,将吞噬指数变量调入DependentVariable (因变量) 中,将升白细胞药物、纯苯调入Fixed Factor(s) (固定因素) 中,点击Model…按钮打开Univariate: Model对话框,选择Custom选项,选择Build Term(s)中的interaction ,点击左侧的升白细胞药物和纯苯则将二者的交互效应项(纯苯*升白细胞药物)调入右侧的Model栏,再选择Build Term(s)中的Main Effects,点击左侧的升白细胞药物和纯苯则将二者的主效应项(纯苯、升白细胞药物)调入右侧的Model栏,→Continue,点击Options…按钮打开Univariate: Options对话框,选择√Descriptives statistics 选项,→Continue →OK完成。

3. 结果判读

输出结果见表7.28~7.29。

表7.28显示的是“升白细胞药物”和“纯苯”两因素在单独效应、主效应和交互效应下的“吞噬指数”的均数、标准差等大小。

表7.29显示的是“升白细胞药物”和“纯苯”两因素在主效应和交互效应下的“吞噬指数”的假设检验结果。结果为:升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322

> 0.05,即两因素的交互效应无统计学意义;升白细胞药物的主效应:F=1.5192, P=0.2355 > 0.05,即升白细胞药物的主效应无统计学意义;纯苯的主效应:F=1857.0087, P < 0.001,

即纯苯的主效应有统计学意义。

思考题

1. 分组变量和分组标志值的区别。

2. 单因素方差分析、随机区组设计的方差分析和析因分析的区别。

第八章χ 2 检验

一、四格表χ2检验

㈠使用Crosstabs命令

SPSS主要通过Analyze →Descriptive Statistics 4→Crosstabs…分析完成对某资料的四格表χ2检验。

注意:SPSS的Analyze →Nonparametric Tests 4→Chi-Square…命令是针对单样本χ2检验的。

㈡例题及分析过程

下面通过对教材第125页例8.3的四格表做χ2检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp8.3.sav)

2. 加权例数

若非原始数据而是整理好的频数表数据(即四格表),需要加权例数(Weight cases)。

Data →Weight cases … →打开Weight cases对话框,将频数变量f移入Weight cases by选项下的Frequency Variable:栏中,OK完成。

3. x2 检验

Analyze →Descriptive Statistics 4→Crosstabs…打开Crosstabs对话框,将处理方法变量(t)移入Row(s)列表栏里,将疗效变量(r)移入Column(s)列表栏里,点击Statistics…按钮打开Crosstabs: Statistics对话框,选择√ Chi-Square选项, →Continue ,点击Cells…按钮打开Crosstabs: Cell Display对话框,选择√ Expected及√ Row选项, →Continue →OK完成。

4. 结果判读

输出结果见表8.19~8.20。表8.19中显示了四格表的实际频数(Count)、理论频数(Expected Count)、行百分数(% within 处理方法)等结果。

表8.20中显示了四格表的检验结果。其中χ2=6.508,P=0.011<0.05。此外还提供了确切概率法(Fisher?s Exact Test )得到的精确检验概率P=0.014(双侧)。表下的注释还提供了四格表中理论频数小于5的格子数及占总格子数的百分比,最小理论频数的大小。本例所有格子的理论频数都大于5,最小理论频数的大小为7.70

二、配对四格表χ2检验

㈠使用2 Related Samples命令

SPSS主要通过Analyze →Nonparametric Tests 4→2 Related Samples…分析完成对某资料的配对四格表χ2检验。配对四格表χ2检验又称McNemar检验。

㈡例题及分析过程

下面通过对教材第133页例8.6的配对四格表做χ2 检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp8.6.sav)

2. 加权例数:具体操作步骤参见上例。

3. 配对χ 2 检验

Analyze →Nonparametric Tests 4→2 Related Samples…打开Two-Related-Samples Tests对话框,选择A培养基变量(a)和B培养基变量(b)作为配对变量,调入右侧的Test Pair(s) List:栏里,在Test Type里选择√ McNemar选项, 去掉Wilcoxon选项,→OK完成。

4.结果判读

输出结果见表8.27~8.28。表8.28中显示了配对四格表的检验结果。P=0.021<0.05,差异有

统计学意义。

注意:SPSS 还可以使用Crosstabs…分析来完成配对四格表 χ2 检验。

三、行×列表 χ2 检验

㈠ 使用Crosstabs 命令

SPSS 通过Analyze → Descriptive Statistics 4 → Crosstabs…分析完成对某资料的行×列表 χ2 检验。

㈡ 例题及分析过程

下面通过对教材第110页例8.1的资料中第一问做 χ 2 检验来讲述操作步骤及结果的判读。

1. 打开数据文件(见exp

2.1.sav )

2. 行×列表 χ2 检验

Analyze → Descriptive Statistics 4 → Crosstabs…打开Crosstabs 对话框,将感染与否变量(infect )移入Row(s)列表栏里,将手术中输血次数变量(bn )移入Column(s)列表栏里,点击 Statistics…按钮打开Crosstabs: Statistics 对话框,选择√ Chi-Square 选项, → Continue → OK 完成。

3.结果判读

输出结果见表8.1~8.2。

表8.1显示了感染组与非感染组的各自输血次数形成的行×列表(2 × 5表)的结果。 表8.2显示了此行×列表的检验结果。χ2=12.317,P=0.015<0.05,差异有统计学意义。但注意表下的注释a 的说明:有4个格子的理论频数小于5,占总格子数(10)的40.0%(4/10)。超过了行×列表的适用条件(不宜有1/5以上的格子的理论频数小于5), 因此上述χ2值是不可信的。

我们可以采取以下三种措施之一:

⑴ 扩大样本含量。

⑵ 合理的合并。(参见教材的相关内容)

⑶ 采用精确检验(Exact Test )。

若采用精确检验,只需在Crosstabs 对话框下部点击Exact…按钮,在打开的Exact Test 对话框中选择Exact 选项或Monte Carlo 选项即可。本例选择Exact 选项,→ Continue

→ OK 完成。

输出结果见表8.2a 。与表8.2相比,多出了精确检验(Fisher?s Exact Test )的结果, P=0.006 < 0.05,说明感染组与非感染组的各自输血次数是不同的。

当行×列表(多于四格)的 χ2 检验拒绝H0时,只能得出总的差异有统计学意义,若要进行两两比较,需要进行χ2 分割,即把行×列表分割成多个2 ×C 表比较,由于重复多次的假设检验增大了I 类错误α,常采用重新规定检验水准α的方法进行校正。常用的校正公式见下:

N α

α=' 2

)1(2-==n n C N n 其中N 为两两比较的次数,n 为要检验的组数。 SPSS 未提供定性资料的两两比较方法。 我们可以采取对要比较的分组变量的分组标志值定义缺失值的办法来进行两两比较。即只保留要比较的两组的分组标志值,其余的定义成缺失值。此法利用了SPSS 默认不对缺失值进行分析的设置。

下面通过对教材第116页例8.2的数据做两两比较来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp8.

2.sav )

2. 行×列表 χ2 检验

操作步骤略,输出结果见表8.10~8.11。结果显示:χ2=297.375,P<0.001。

3. 两两分组

首先进入SPSS Data Editor窗口,点击Variable View名签进入变量定义窗口,点击变量(area)

的Missing属性单元格的右侧,弹出Missing Values对话框,选择Discrete missing values选项并在其中的格子中敲入3(即北美洲人组的分组标志值),→OK完成。

4. 两两比较

Analyze →Descriptive Statistics 4→Crosstabs…打开Crosstabs对话框,将地区变量(area)移入Row(s)列表栏里,将血型变量(type)移入Column(s)列表栏里, 点击Statistics…按钮打开Crosstabs: Statistics对话框,选择√ Chi-Square选项, →Continue →OK完成。

5.结果判读:

输出结果见表8.12~8.13。结果显示:χ2=151.574,P<0.017。说明亚洲和欧洲人的血型构成有统计学上的差异显著性(Significance)。

注意:此处的检验水准为校正后的值,即α=0.05/3=0.017,3为两两比较的次数。

6. 其它两两比较

仿上述1. ~ 5.步,操作步骤略。

第九章秩和检验

一、配对比较的秩和检验

㈠使用2 Related Samples命令

SPSS通过Analyze →Nonparametric Tests 4→2 Relat ed Samples…分析完成对某资料的配对比较的秩和检验。配对比较的秩和检验又称Wilcoxon配对法。

注意:SPSS的许多统计分析方法是以其发明人的名字冠以命令关键字的,如McNemar检验、Wilcoxon配对法等。

㈡例题及分析过程

下面通过对教材第137页例9.1的资料做配对比较的秩和检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp9.1.sav)

2. 配对比较的秩和检验

Analyze →Nonparametric Tests 4→2 Related Samples…打开Two-Related-Samples Tests对话框,选择EDTA法变量(edta)和重量法变量(weight)作为配对变量,调入右侧的Test Pair(s) List:栏里,→OK完成。

3. 结果判读

输出结果见表9.2~9.3。结果显示:Wilcoxon Signed Ranks Test, Z=-0.420,P=0.674> 0.05。说明两种方法检测结果基本一致。

二、两样本比较的秩和检验

㈠使用2 Independent Samples命令

SPSS通过Analyze →Nonparametric Tests 4→2 Independent Samples…分析完成对某资料的两样本比较的秩和检验。两样本比较的秩和检验可用Wilcoxon两样本法,也可用Mann-Whitney U检验法。

㈡例题及分析过程

下面通过对教材第139页例9.2的资料做两样本比较的秩和检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp9.

2.sav)

2. 两样本比较的秩和检验

Analyze →Nonparametric Tests 4→2 Independent Samples…打开Two-Independent-Samples Tests对话框,把血铅值变量(bp)调入Test V ariable List:栏里,把分组变量(group)调入

Grouping Variable:栏里,点击Define Groups…按钮打开Two Independent Samples: Define Groups对话框定义分组标志值1和2, →Continue →OK完成。

3. 结果判读

输出结果见表9.5~9.6。结果显示:Mann-Whitney U=10.500,Wilcoxon W=38.500, Wilcoxon Z=-2.027, P=0.043 < 0.05。说明铅作业和非铅作业工人的血铅值不同。

三、多个独立样本比较的秩和检验

㈠使用K Independent Samples命令

SPSS通过Analyze →Nonparametric Tests 4→K Independent Samples…分析完成对某资料的多个独立样本比较的秩和检验。多个独立样本比较的秩和检验又称Kruskal-Wallis检验。㈡例题及分析过程

下面通过对教材第141页例9.3的资料做多样本比较的秩和检验来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp9.3.sav)

2. 多样本比较的秩和检验

Analyze →Nonparametric Tests 4→K Independent Samples…打开Tests for Several Independent Samples 对话框,把体重增加量变量(value)调入Test Variable List:栏

里,把分组变量(group)调入Grouping Variable:栏里,点击Define Range…按钮打开Several Independent Samples: Define Range对话框定义分组标志值范围1 ~ 3, →Continue →OK完成。

3. 结果判读

输出结果见表9.8~9.9。结果显示:Kruskal-Wallis χ 2 = 9.152, P=0.010 < 0.05。说明甲、乙、丙三种饲料对白鼠的体重增加量总体上不同。

由于SPSS未提供多个独立样本比较的秩和检验的两两比较方法,故我们依然可以采取对要比较的分组变量的分组标志值定义缺失值的办法来进行两两比较,并且重新规

定检验水准的大小,具体方法可参见前述或教材内相关内容。

思考题

1. 为什么对于分类频数表资料做χ2检验前需要先加权例数(Weight cases)?

2. 如何实现行×列表的χ2检验和多个独立样本比较的秩和检验的两两比较?

3. 如何查看分组标志值的定义?

第十章相关与回归

一、一元线性相关与回归

㈠使用命令

SPSS通过Analyze →Correlate 4→Bivariate…分析完成对某资料的直线相关分析。SPSS通过Analyze →Regression 4→Linear…分析完成对某资料的直线回归分析。

注意:一元线性相关又称直线相关,一元线性回归又称直线回归。

㈡例题及分析过程

下面通过对教材第149页例10.1的资料做直线相关与回归分析来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp10.1.sav)

2. 正态性检验及绘制散点图

利用Explore的Shapiro-Wilk Test分别对发硒变量(hairsi)和血硒变量(bloodsi)做正态性检验,其结果见表10.2。结果表明两变量均服从正态分布。

使用Graphs→Scatter/Dot…→选择Simple Scatter →

Define →打开Simple Scatterplot对话框,将bloodsi变量调入Y Axis:栏中,将hairsi变量调

入X Axis:栏中,→ OK 完成散点图的绘制。从图10.1a 上可以看出发硒与血硒存在 直线变化趋势。

3. 直线相关

Analyze → Correlate 4 → Bivariate…打开Bivariate Correlations 对话框,将双变量hairsi 和bloodsi 调入 Variables:栏中,→ OK 完成。

4. 结果判读

输出结果见表10.3。表中显示了发硒与血硒的相关系数 r = 0.880,P < 0.001。说明发硒与血硒存在直线相关关系。

5. 直线回归

Analyze → Regression 4 → Linear…打开Linear Regression 对话框,将bloodsi 变量调入Dependent:栏中,将hairsi 变量调入Independent(s):栏中, → OK 完成。

6. 结果判读

输出结果见表10.4~10.7。

表10.4中显示了回归采取的方法。本例采取的是Enter 法,即所有自变量都进行分析。 表10.5显示了用方差分析对回归方程做的假设检验。本例F =34.156,P < 0.001。说明回归方程有意义。

表10.6显示了回归方程中的系数及针对该系数所做的假设检验。本例截距(又称常数项)a=-6.943, hairsi 变量的系数(即直线回归系数)b=0.239,则直线回归方程为: )(239.0943.6)(?hairsi X bloodsi Y

+-= 表10.7显示了回归分析的一些其它统计信息(相关系数R 、决定系数R 2等)。本例R 2=0.774(双侧)。

关于教材第154页的“三、频数表资料的相关与回归”的内容自学。

* 二、多元相关分析

教材第161页第二节中所求得的多个变量之间的相关分析实质就是直线相关分析(双变量)的简单扩展。 多个变量之间的相关分析得出的某两个变量之间相关系数只能反映单独某个变量a 与单独某个变量b 的密切联系程度,而不能考虑其它变量(c 、d 、…)对某个变量(a 或b )的影响效应。 若要扣除其它变量的影响后再求某两个变量之间相关系数,则称此相关系数为偏相关系数(partial correlation coefficient ),SPSS 可以使用Analyze → Correlate 4 → Parti al …完成偏相关分析。

教材第161页例10.3的资料,若只做简单相关分析,操作步骤与直线相关分析几乎完全相同,唯一的区别就是把两个变量换成了六个变量(X1~X6)。分析结果见表10.19。

其中体重(X1)与上臂围(X4)的Pearson 相关系数r=0.866,P < 0.001。说明二者相关。但如果求二者的偏相关系数=0.540,P = 0.167> 0.05(见表10.19a )。说明在控制身高、胸围、三头肌和肩胛下角四个变量下,体重与上臂围二者实际是不相关的。造成二者简单相关有意义的原因在于三头肌与上臂围是相关的,因为二者的 Pearson?s r=0.681, P = 0.015 < 0.05 ,见表10.19。

建议在进行多个变量之间的相关分析时,要把简单相关分析和偏相关分析结合起来。 * 三、多元线性回归(包括多元逐步回归) 多元线性回归是研究一个因变量(Dependent )和多个自变量(Independent )之间线性依存关系的统计方法。 其模型表达式(常称多元线性回归方程)见下:k

k X b X b X b b Y ++++=...?22110

其中bj 为自变量Xj 的偏回归系数( partial regression coefficient )。根据最小二乘法(least square method )可以求出系数bj 的大小。

SPSS 通过Analyze → Regression 4 → Linear…分析完成对某资料的多元线性回归分析。 下面通过对教材第166页例10.4的资料做多元线性回归分析来讲述操作步骤及结果的判读。

1. 建立数据文件(见exp10.4.sav )

2. 适用条件判断略。

3. 多元线性回归分析( Enter )

Analyze → Regression 4 → Linear…打开Linear Regression 对话框,将y 变量(血红蛋白)调入Dependent:栏中,将x 1、x 2、x 3变量(钙、铁、锰)调入Independent(s):栏中, → OK 完成。

4. 结果判读

输出结果见表10.22~10.25。

表10.22显示了多元回归采取Enter 的方法。

表10.23显示了复相关系数R =0.802。

表10.24显示了用方差分析对多元回归方程做的假设检验。本例F =9.627,P = 0.001 < 0.01。说明多元回归方程有意义。

表10.25显示了多元回归方程中的系数及针对每个系数所做的假设检验。本例x 2变量( P < 0.001 )有统计学意义, x 1变量( P=0.053 > 0.05 )和 x 3变量( P=0.647 > 0.05 )均无统 计学意义。

5. 多元线性回归分析(调整)

由于出现两个没有统计学意义的自变量( x 1与x 3),因此在调整自变量的组成时,最佳策略是首先把最没意义的变量( x 3 )去掉,由其余变量( x 1与x 2 )再重做多元线性回归分析。

具体操作步骤参见3. 。

6. 结果判读

输出结果见表10.26~10.29。

表10.26显示了多元回归仍采取Enter 的方法。

表10.27显示了复相关系数R =0.799。

表10.28显示了调整后的多元回归方程的假设检验。本例F =15.023,P < 0.001。说明调整后的多元回归方程仍有

意义。

表10.29显示了调整后的多元回归方程中的系数及针对每个系数所做的假设检验。本例 x 1变量( P=0.047 < 0.05 )和 x 2变量( P < 0.001 )均有统计学意义。

本例最后得到的优化的多元回归方程为:2

1032.0053.0567.1?x x Y +-= 注意:在比较x 1与x 2 的系数(0.053与0.032)对因变量的作用时,不能直接比,而应该选用标准化系数( Standardized Coefficient )进行比较。x 1与x 2 的标准化系数分别为0.323和0.821,说明x 2对因变量的作用要大于x 1。

* 多元逐步回归 由于多元线性回归分析是研究一个因变量和多个自变量之间线性依存关系,而在多个自变量中,不一定每一个变量对因变量的影响都有统计学意义,因此需要通过某种方法寻找出一个最优化的多元回归方程,即能够使方程中的每一个自变量对因变量的影响都有统计学意义。 多元逐步回归就是一个利用逐步(stepwise )选择有统计学意义的自变量的过程来获得最优化的多元回归方程的统计学方法。

SPSS 实现多元逐步回归的方法是在Analyze →Regression 4 → Linear…打开Linear Regression 对话框, 通过在Method:下拉框中点击选择stepwise 来完成。

下面通过对教材第166页例10.4的资料做多元逐步回归分析来讲述操作步骤及结果的判读。

1. 打开数据文件(见exp10.4.sav )

2. 多元逐步回归分析( Stepwise )

Analyze → Regression 4 → Linear…打开Linear Regression 对话框,将y 变量(血红蛋白)调入Dependent:栏中,将x 1、x 2、x 3变量(钙、铁、锰)调入Independent(s):栏中,在Method:下拉框中点击选择stepwise ,→OK 完成。

3. 结果判读

输出结果见表10.30~10.34。

表10.30中显示了多元逐步回归的步骤。第一步引进自变量x 2 , 第二步引进自变量x 1 。二者使用的准则( Criteria)都是:引进的概率P ≤0.050,剔除的概率P ≥0.100 。

表10.31显示了第一步引进自变量x 2 ,R 2=0.542;第二步引进自变量x 2和 x 1,R 2=0.639。 表10.32显示了第一步引进自变量x 2 后的回归方程有意义(F =21.265,P < 0.001 );第二步引进自变量x 2和 x 1后的回归方程也有意义(F =15.023,P < 0.001 )。表10.33显示了第一步引进自变量x 2 后的回归方程中相应系数的大小及其假设检验的结果( x 2 的系数b2=0.029, P<0.001 ;常数项(Constant)的系数 b0=-0.242,P=0.927);

第二步引进自变量x 2和 x 1后的回归方程中相应系数的大小及其假设检验的结果( x 2 的系数b2=0.032,P<0.001 ;x 1 的系数b1=-0.053,P=0.047;常数项的系数 b0=1.567, P=

0.542)。故本例题的回归方程为:2

1032.0053.0567.1?x x Y +-= 表10.34显示了多元逐步回归分析中每步未进入方程的自变量的情况。

第十一章 Logistic 回归(介绍)

前述的多元线性回归分析是研究一个因变量和多个自

变量之间线性依存关系,但它要求因变量和自变量都为定量数据,当因变量和自变量出现分类数据时,多元线性回归分析就不适用了。

Logistic 回归是一个分析某个二分类(或多分类)因变量与多个自变量(包括分类变量、等级变量和数值变量)关系的有力工具。它常用于流行病学中研究疾病发生与危

险因素间的关系,还可用于病因学的队列研究、病例-对照研究、临床诊断的判别模型、治疗效果评价等。

SPSS 通过Analyze → Regression 4 → Binary Logistic …命令完成二分类的因变量的Logistic 回归。

SPSS 通过Analyze → Regression 4 → Multinomial Logistic …命令完成多分类的因变量的Logistic 回归。

SPSS 提供了六种筛选自变量的方法:forward conditional, forward LR, forward Wald, backward conditional, backward LR, or backward Wald 。其作用都差不多,但建议少用Wald 检验。 教材第189页例11.1的资料,作者采用先单因素分析对自变量进行筛选,再把筛选出有统计学意义的自变量引入Logistic 回归中,选择Enter 的方法是不合理的。因为单因

素分析不能考虑变量之间的交互效应以及变量之间的相关性对因变量的影响。合理的步骤应该是:直接把所有研究者关心的变量列入Logistic 回归分析的自变量列表里,选择一个合理的筛选变量的方法(如Forward:LR)进行分析。单因素分析的结果只能作为一个辅助分析的参考。

对于例11.1的资料,作者先采取对定性变量(性别sex 、手术方式pt 、疾病部位da 、手术中输血次数bn )分别和感染与否infect 变量进行χ2 检验来找出有统计学意义的变量,对定量

变量(年龄age、红细胞压积hct、手术持续时间time、手术中失血量lb、手术中输血量bc)分别以感染与否infect变量分组进行t检验来找出有统计学意义的变量,

结果得到影响感染与否的自变量有:手术中输血量bc、疾病部位da和手术中输血次数bn 。注意的是:这里的分析没有考虑到的变量手术中输血次数bn与手术中输血量bc的专业相关性,这就会为以后的分析留下隐患。

作者接着对上述三个变量进行Logistic回归分析,并选择Enter的方法。分析结果显示三个变量的Wald检验概率大小,手术中输血量bc的Wald检验概率P=0.977最大,因此接下来剔除bc再作了一次Logistic回归,结果显示最后剩下的两个变量:手术中输血次数bn和疾病部位da的Wald检验概率P均小于0.05,至此找到了影响感染与否的有统计学意义的自变量。

若直接把上述作者涉及到的所有自变量列入Logistic回归的自变量列表里,选择一个合理的筛选变量的方法进行分析。操作步骤如下:

1. 打开数据文件(见exp

2.1.sav)

2. Logistic回归分析(Forward:LR)

Analyze →Regression →Binary Logistic …打开Logistic Regression对话框,将因变量(infect)调入Dependent:栏中, 将自变量sex、age、hct、pt、da、time、lb、bn、bc调入Covariates:栏中,在Method:下拉框中点击选择Forward:LR,→OK完成。

3. 结果判读

输出主要结果见表11.25~11.28。

表11.25显示了Block 0区引入常数项的统计结果。本例常数项有统计学意义(Wald值=18.669,P < 0.001)。

表10.26显示了Block 0区未引入的所有自变量的得分检验(Score Test)结果。实质就是单因素分析结果。本例从结果中可以看出bc、da和bn均有统计学意义,结论与作者相同。

表10.27显示了Block 1区也就是采取逐步向前似然比检验法[Forward Stepwise(Likelihood Ratio)]对所有自变量的筛选结果。最后一步(Step 2)的输出结果是Logistic回归分析最重要的,因为它提供了优化后的最终回归方程的相关信息。有最终筛选出的自变量、变量系数(B)、标准误( S.E.)、Wald卡方值(Wald)、自由度(df)、P值(Sig.)以及Exp(B)(即OR值)。本例最终筛选出的自变量是da和bc。

表10.28显示了Block 1区每步未引入的所有自变量的得分检验(Score Test)结果。

上述结果与作者的做法截然不同。原因在于手术中输血次数bn与手术中输血量bc在专业上是相关的,而选择bc要比bn要科学合理。

关于多分类的Logistic回归分析的实现方法请参见SPSS的相关参考书。

思考题

1. 为什么在做直线相关与回归分析时,必须先绘制散点图(Scatter plot)?

2. 一元线性相关与回归、多元线性相关与回归和Logistic回归分析的区别。

第十六章统计图

一、条形图

SPSS通过Graphs→Bar…命令绘制条形图(亦称直条图)。

㈠单式条形图(Simple Bar Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.1 绘制例2.1资料中手术方式变量pt的单式条图。

操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制条形图;

Graphs→Bar… 打开Bar Charts对话框,点击选择Simple格式,选择Data in Chart Are栏中的Summaries for groups of cases选项→Define →打开Define Simple Bar: Summaries for Groups of Cases对话框,将手术方式变量pt调入Category Axis:栏里,点击选择Bars Represent 栏中的N of cases选项(因为pt变量为分类数据,选此项表示条形图的高低代表例数) →OK 完成。

⑶条形图的再编辑(可选)。

输出图形见图16.4。若要对图形进一步调整编辑,需双击图形区域打开图形编辑窗口(Chart Editor),利用SPSS所提供的图形编辑功能作调整,具体参见教材第269~270页内容或SPSS 相关参考书,此处略。本例若对图形的纵横轴的数字及字体放大使之更清晰,调整后的图形见图16.4a。

2. 不同变量的汇总统计(Summaries of separate variables)

例16.2 绘制例2.1资料中手术中失血和输血量变量lb和bc的均数的单式条图。操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制条形图;

Graphs→Bar… 打开Bar Charts对话框,点击选择Simple格式,选择Data in Chart Are栏中的Summaries of separate variables选项→Define →打开Define Simple Bar: Summaries of Separate Variables对话框,将手术中失血量变量lb和手术中输血量变量bc调入Bars Represent:栏里(因为lb和bc两变量均为定量数据,SPSS默认求均数MEAN选项表示条形图的高低代表变量值的均数) →OK完成。

⑶条形图的再编辑(可选)。

输出图形后经调整,结果见图16.9。

3. 各独立记录的变量值(Value of individual cases)

例16.3 绘制例2.1资料中手术中输血次数变量bn的每个记录的手术中输血次数的单式条图。

操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制条形图;

Graphs→Bar… 打开Bar Charts对话框,点击选择Simple格式,选择Data in Chart Are栏中的Value of individual cases选项→Define →打开Define Simple Bar: Values of Individual Cases对话框,将手术中输血次数变量bn调入Bars Represent:栏里→OK完成。

⑶条形图的再编辑(可选)。

输出图形后经调整,结果见图16.11。

㈡复式条形图(Clustered Bar Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.4 绘制例2.1资料中按性别变量sex分组的疾病部位变量da的复式条图。

操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制条形图;

Graphs→Bar… 打开Bar Charts对话框,点击选择Clustered格式,选择Data in Chart Are 栏中的Summaries for groups of cases选项→Define →打开Define Clustered Bar: Summaries for Groups of Cases对话框,将疾病部位

变量da调入Category Axis:栏里,将性别变量sex调入Define Clusters by:栏里→OK完成。

⑶条形图的再编辑(可选)。

输出图形后经调整,结果见图16.13。

2. 不同变量的汇总统计(Summaries of separate variables)(自学)

3. 各独立记录的变量值(Value of individual cases)(自学)

㈢分段条形图(Stacked Bar Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.5 绘制例2.1资料中不同手术方式(变量pt)下的手术中输血次数(变量bn)的复式条图。

操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制条形图;

Graphs→Bar… 打开Bar Charts对话框,点击选择Stacked格式,选择Data in Chart Are栏中的Summaries for groups of cases选项→Define →打开Define Stacked Bar: Summaries for Groups of Cases对话框,将不同手术方式变量pt调入Category Axis:栏里,将手术中输血次数变量bn调入Define Stacks by:栏里→OK完成。

⑶条形图的再编辑(可选)。输出图形后经调整,结果见图16.15。

2. 不同变量的汇总统计(Summaries of separate variables)(自学)

3. 各独立记录的变量值(Value of individual cases)(自学)

二、饼图

SPSS通过Graphs→Pie…命令绘制饼图(亦称圆图)。

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.6 绘制例2.1资料中手术方式变量pt的饼图。

操作步骤如下:

⑴打开数据文件;(见exp2.1.sav)

⑵绘制饼图;

Graphs→Pie…打开Pie Charts对话框,点击选择Data in Chart Are栏中的Summaries for groups of cases选项→Define →打开Define Pie: Summaries for Groups of Cases对话框,将不同手术方式变量pt调入Define Slices by:栏里→OK完成。

⑶饼图的再编辑(可选)。输出图形后经调整,结果见图16.22或图16.22a 。

2. 不同变量的汇总统计(Summaries of separate variables)(自学)

3. 各独立记录的变量值(Value of individual cases)(自学)

三、线图

SPSS通过Graphs→Line…命令绘制线图。

㈠单式线图(Simple Line Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.7 绘制例2.1资料中不同月龄(变量age)的手术持续时间(变量time)的单式线图。

⑴打开数据文件;(见exp2.1.sav)

⑵绘制线图;

Graphs→Line… 打开Line Charts对话框,点击选择Simple格式,选择Data in Chart Are栏中的Summaries for groups of cases选项→Define →打开Define Simple Line: Summaries for Groups of Cases对话框,将月龄age调入Category Axis:栏里,点击选择Lines Represent栏中的Other statistic(e.g., mean)选项,将手术持续时间time调入variable:栏里(因为time变量为定量数据,选此项默认用每个月龄的手术持续时间的均数表示线上的点) →OK完成。

⑶线图的再编辑(可选)。

输出图形后经调整,结果见图16.23a。

2. 不同变量的汇总统计(Summaries of separate variables)(自学)

3. 各独立记录的变量值(Value of individual cases)(自学)

㈡复式线图(Multiple Line Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.8 绘制例2.1资料中按性别变量sex分组的不同月龄(变量age)的手术持续时间(变量time)的复式线图。

⑴打开数据文件;(见exp2.1.sav)

⑵绘制线图;

Graphs→Line… 打开Line Charts对话框,点击选择Multiple格式,选择Data in Chart Are 栏中的Summaries for groups of cases选项→Define →打开Define Multiple Line: Summaries for Groups of Cases对话框,将月龄age调入Category Axis:栏里,点击选择Lines Represent 栏中的Other statistic(e.g., mean)选项,将手术持续时间time调入variable:栏里,将性别sex 调入Define Lines by:栏里,→OK完成。

⑶线图的再编辑(可选)。

输出图形后经调整,结果见图16.26a。

本例题若按手术方式变量pt分组绘制的复式线图见图16.26b。

2. 不同变量的汇总统计(Summaries of separate variables)(自学)

3. 各独立记录的变量值(Value of individual cases)(自学)

㈢垂线图(Drop-line Chart)

1. 同一变量的分组汇总(Summaries for groups of cases)

例16.9 绘制例2.1资料中按疾病部位(变量da)分组的不同手术中输血次数(变量bn)的手术持续时间(变量time)的垂线图。

⑴打开数据文件;(见exp2.1.sav)

⑵绘制线图;

Graphs→Line… 打开Line Charts对话框,点击选择Drop-line格式,选择Data in Chart Are 栏中的Summaries for groups of cases选项→Define →打开Define Drop-Line: Summaries for Groups of Cases对话框, 将手术中输血次数bn调入Category Axis:栏里,点击选择Lines Represent栏中的Other statistic(e.g., mean)选项,将手术持续时间time调入variable:栏里,将疾病部位da调入Define Points by: 栏里,→OK完成。

⑶线图的再编辑(可选)。

输出图形后经调整,结果见图16.29a。

四、直方图

SPSS通过Graphs→Histogram…命令绘制直方图。

例16.10 绘制例5.1资料中男性红细胞量的直方图。

⑴打开数据文件;(见exp5.1.sav)

⑵绘制直方图;

Graphs→Histogram…打开Histogram对话框,将男性红细胞量(变量hxbl)调入Variable:栏里,→OK完成。

⑶直方图的再编辑(可选)。

输出图形后经调整,结果见图16.31a。

五、散点图

SPSS通过Graphs→Scatter/Dot…命令绘制散点图。

例16.11 绘制例10.1资料中发硒与血硒的散点图。

⑴打开数据文件;(见exp10.1.sav)

SPSS基本操作傻瓜教程

目录 一、SPSS界面介绍 (2) 1、如何打开文件 (2) 2、如何在SPSS中打开excel表 (3) 3、数据视图界面 (3) 4、变量视图界面 (4) 二、如何用SPSS进行频数分析 (11) 三、如何用SPSS进行多变量分析 (15) 四、如何对多选题进行数据分析 (18) 1、对多选题进行变量集定义 (18) 2、对多选题进行频数分析 (21) 3、对多选题进行多变量交互分析 (24) 五、如何就SPSS得出的表在excel中作图 (27)

一、SPSS界面介绍 提前说明:第一,我这里用的是SPSS 20.0 中文汉化版。第二,我教的是傻瓜操作,并不涉及理论讲解,具体的为什么和用什么理论公式来解释请认真去听《社会统计学》的课程。第三,因为是根据我自己的操作和理解来写的,所以可能有些地方显的不那么科学,仍然要说请大家认真去听《社会统计学》的课程,那个才是权威的。 1、如何打开文件 这个东西打开之后界面是这样的: 我们打开一个文件:

要提的一点就是,SPSS保存的数据拓展名是.sav: 2、如何在SPSS中打开excel表 在上图的下拉箭头里找到excel这个选项: 然后你就能找到你要打开的excel表了。 3、数据视图界面 我现在打开了一个数据库。 可以看到左下角这个地方有两个框,两个是可以互相切换的,跟excel切换表一样,跟excel切换表一样: 现在的页面是数据视图,也就是说这一页都是原始数据,这里的一行就是一张问卷,一列就是一个问题,白框里的1234代表的是选项。这个表当时录数据的时候为了方便看,是把ABCD都转换成了1234,所以显示的是1234,当然直接录ABCD也可以,根据具体情况看怎么录,只要能看懂。 多选题的录入全部都是细化到每个选项,比如第四题,选项A选了就是“是”,没选就是

《统计分析与SPSS的应用(第五版)》课后练习答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式各自的特点和应用场合是什么 SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案什么SPSS的变量 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料 体重变化情况 产品类型 明显减轻无明显变化 第一种产品2719 第二种产品2033 问:在SPSS中应如何组织该数据

数据文件如图所示: 5、什么是SPSS的用户缺失值为什么要对用户缺失值进行定义如何在SPSS中指定用户缺失值 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分)

SPSS简易使用手册1

SPSS简易使用手册 屏师初教系陈正昌编 壹、数据从哪里来? 一、政府统计资料:例如教育部出版之教育统计、内政部之台闽人口统计、 法务部之犯罪状况及其分析、主计处之社会指标……,有部分统计数据也放在网络上,可以直接下载。 二、现成调查数据库:台湾社会变迁数据库。 三、他人研究后发表之结果,这可以用来进行整合分析(meta analysis)或次 层分析(secondary analysis)。中央研究院调查研究中心近年来积极汇整各种调查研究数据,研究者可以提出研究计划向其申请或直接在网络上下载。 四、实验后所得数据。 五、自行使用调查法(面谈、电访,或问卷) 所得之资料。 贰、现成数据如何读入? 一、在「档案」的选单下选择「开启旧文件」中之「数据」。

二、内定为SPSS之系统文件,选择所需档案即可。 三、SPSS也可以开启Excel或dBase等软件之数据文件。 四、E xcel数据文件如果第一列有变量名称,则应勾选「从数据第一列开始 读取变量名称」。

参、如何自行输入数据 一、先建立编码簿(codebook) 变量名称变数批注变数性质资料性质字段数选项数值说明 sex 性别名义变数字符串 1.0 M:男W:女 area 地区名义变数数字 1.0 1:北部2:中部3:南部4:东部 age 年龄量尺变数数字 2.0 year 教学年资次序变数数字 2.0 1:5年以下2:6~10年3:11~20年4:21年以上a1-1 薪资满意度量尺变数数字 1.0 1:很不满2:不满意3:满意4:很满意 a1-2 环境满意度量尺变数数字 1.0 1:很不满2:不满意3:满意4:很满意 b1-1 进修意愿量尺变数数字 1.0 1.很不符2:不符合3:符合4:很符合 b1-2 留职意愿量尺变数数字 1.0 1.很不符2:不符合3:符合4:很符合height 身高量尺变数数字 5.1 weight 体重量尺变数数字 4.1 二、在SPSS中选择「输入数据」 三、在「变量检视」窗口中输入变量名称,并选择变量类型

spss应用

第二部分SPSS软件的应用指南 第一章数据文件 数据文件是统计分析的基础,它提供系统分析所需的数据。数据文件既可由SPSS系统数据文件编辑窗口产生,也可以以其他数据库文件或电子表格的数据文件转换生成。 第一节数据文件的建立命令 一、定义变量(Define Variable) 定义变量就是建立数据文件的结构,输入数据之前要定义变量。打开SPSS系统,进入SPSS的数据编辑窗口。在数据编辑窗口的左下方有两个工选择的按钮,分别是数据浏览和变量浏览。如图1~2: 图2 数据浏览和变量浏览 选定数据浏览(Data View),系统进入数据输入、编辑、修改状态;选定变量浏览(Variable View),系统进入变量定义、修改状态。 当选定变量浏览状态后,可看见在窗口上方有一行英文标记,即变量属性标记。

:变量名。在其下面的方格里输入变量名,英文、中文都可,系统默认值为V AR00001,如变量名都采取系统默认,则依次为V AR00002、V AR00003…。如不采用系统默认值。其变量名的命名有以下原则: ⑴变量名不能多于8个字符(一个汉字为两个字符); ⑵英文名,首字符必须是字母,其后可为除“?”、“!”、“*”的以外字符,不能以“-”、“.”作为变量名的最后一个字符; ⑶变量名不能与SPSS保留字相同。SPSS保留字有:ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WTTH; ⑷变量名英文字母不区分大小写。 :变量类型。系统默认为数值型(Numeric)。如需重新定义,则点击,后面出现“…”,点击“…”,进入数据类型对话框,如图3 图中, :标准数值类型变量,默认长度为8位,小数位数2位。SPSS中多数变量都是数值型变量。 :带逗点的数值变量。从小数点向左右三位一小节,用逗点分节。 :带圆点的数值变量。从小数点向左右三位一小节,用圆点分节,小数点用逗点表示。 :科学计数法的数值变量。 :日期时间型变量。比较常用的是“mm/dd/yyyy”型,即月月/日日/年年年年,如08/15/2000表示2000年8月15日。 :带美元($)符号的变量。 :用户自定义型变量。可通过Edit Option Data实现。 :字符型变量。默认长度为8位。 :变量数据位数长度。默认为8位。 :变量数据的小数位数长度。默认为2位。 :变量标签。在此栏中可输入中、英文字符,用以对变量进行说明。例如:性别变量名用英文“sex”表示,则变量标签可用中文“性别”标识。变量标签的字符最多可达255个。 :变量数值标签。对某些用数值代码输入的数据,此项是对数值的说明。如:1表示

SPSS简明教程(绝对受用)

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

SPSS教程(完整)

第二章 SPSS统计应用 第一节 SPSS基础 SPSS(Statistical Package for the Social Sciences)即社会科学统计软件包,是当今世界上公认的最流行、最强大的三大统计分析软件(SPSS、SAS和BMDP)之一。SPSS从10.0版本开始就基于Microsoft Windows 95操作系统上运行,具有Windows软件的共同特征。由于SPSS具有统计、绘图功能强、使用简单方便等优点。受到广大科研工作者的青睐。 在这里主要以12.0版为基础,介绍SPSS的基本使用方法。 一、SPSS安装和运行 1 SPSS v12.0 安装 打开计算机,启动Windows XP操作系统。 1) 将课程配备的光碟放入光盘驱动器中。 2) 启动Windows资源管理器,双击光盘驱动器图标,在目录窗口中找到“SPSS12 install”文件夹,双击进入该文件夹;找到“setup”应用程序,双击后就启动安装。显示欢迎安装SPSS 12.0版以及版权声明(图2-1),浏览后单击“Next”按钮进入下一个画面。 图2-1 SPSS12.0欢迎窗口 3)同意SPSS12.0软件协议 用户阅读“协议”,同意协议,单击“I accept the terms in license agreement”选项。 否则单击“Cancel”退出安装,如图2-2。

图2-2 软件协议窗口 4)阅读SPSS 12.0 自述文件后,单击“Next”按钮,进入下一个界面。5)填写用户信息。 例如:在用户名“Name:”栏填写: Student 在单位名称“Organization:”栏填写: SWU 如图2-3。单击“Next”按钮,进入下一个界面。 图2-3填写用户信息 5)指定SPSS12.0系统的安装目录(图2-4)

SPSS基本操作步骤详解

SPSS基本操作步骤详解 本文采用SPSS21.0版本,其它版本操作步骤大体相同 一、基本步骤 (一)检查数据 在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。 例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。 1.执行次数分布表的程序 Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定) 2.执行描述统计量的程序 Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定) (二)反项计分 若是分析的预试量表中没有反向题,则此操作步骤可以省略; 量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。 例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。 Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】 (三)题项加总 量表题项加总的目的在于便于进行观察值得高低分组。 例,“XX量表”采用Likert scale五点量表式填答,题项为:a1,a2……a10,记总分为:az。 Transform(转换)→Computer Variable(计算变量)→在左边Target Variable(目标变量)中键入az,在右边Numeric Expression(数字表达式)中键入a1+a2+……+a10

SPSS操作方法

统计分析软件SPSS操作方法 SPSS for Windows的启动和退出 图2 软件启动 在鼠标顺序单击“开始”——“程序”——“SPSS 10.0 for Windows”——“SPSS 10.0 for Windows”启动条之后,SPSS启动界面如图2所示。

图3 启动界面 如需要退出程序可单击右上角的“×”或左上角“File”下的“Exit”即可退出。如果在本次SPSS期间激活的窗口如DATA窗口、OUTPUT窗口的有关内容已经作为文件存盘,则系统直接退出SPSS系统。否则系统会对各窗口一一提问:是否保存×××窗口的内容。用户可按自己的意愿一一给以回答。随后,结束本次SPSS期间,退出SPSS系统。 菜单及窗口介绍 由图3所示,SPSS软件的主菜单主要包括10项: ①File:文件操作;②Edit:文件编辑;③View:视图;④Data:数据文件建立与编辑;⑤Transform:数据转换;⑥Analyze:统计分析;⑦Graphs:统计图表的建立与编辑;⑧Utilities:实用程序;⑨Window:窗口控制;⑩Help:帮助。 而数据窗口主要包括两部分内容,data view和variable view两个表格,这一点与EXCEL 软件极为相似,data view主要用来显示需要处理的数据,而variable view则用来为数据不同的变量的性质进行设置,如名字name、类型type、宽度width、小数点位数Decimals等。以下为下一级子菜单的介绍。 1 File 鼠标单击“File”后即打开下一级下拉子菜单。共计包括16项。现主要介绍常用的命令。 图4 File子菜单 “New”与“Open”命令分别为新建和打开一个文件(包括数据文件data、程序文件syntax、结果文件output、脚本文件script、其他文件other)。需要注意的是SPSS10.0可以直接打开EXCEL2000和数据库的文件(其他还有systat、文本、Lotus等格式的文件)。

实验三-IBM-SPSS软件的基本操作

实验三-IBM-SPSS软件的基本操作

云南大学软件学院 实验报告 课程:大数据分析及应用任课教师:蔡莉实验指导教师(签名): 学号: 20131170142 姓名:郭昱专业:软件工程日期: 2015/11/01 成绩: 实验三 IBM SPSS软件的基本操作 一、实验目的 1.熟悉SPSS的菜单和窗口界面,熟悉SPSS 各种参数的设置; 2.掌握SPSS的数据管理功能。 二、实验内容及步骤 (一)数据的输入和保存 1. SPSS界面 当打开SPSS后,展现在我们面前的界面如下: 菜单栏 工具栏

注意:窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似,很多操 作也与EXCEL类似。 2.定义变量 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

假如有两组数据如下: GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 现在SPSS的数据管理窗口如下所示: 第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。 现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示: 现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。 3.输入数据 我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一

《统计分析与SPSS的应用(第五版)》课后练习

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门 一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注:syntax窗口的菜单和SPSS窗口的菜单功能基本一致,区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序 二、熟用Paste 按钮 在SPSS所有菜单对话框中均有Paste功能,在所有对话框选择完毕后,不选择 OK,而使用Paste,则程序编辑窗口会自动生成程序。 此功能使得SPSS编程操作变得简单易行,只需要对生成的程序适当加以修改即可。 示例:运用Paste创建一个程序文件。以xuelin.sav.为例,产生P50页的程序语句,并保存在桌面上备用。

该程序文件可以保存,当下次做相同的分析时,无需重新进行复杂的菜单选择,直接在原有程序文件上进行适当的修改,运行即可。 三、编程进行对话框无法完成的工作 示例1:见书 示例2:怎么产生连续自然数1~200 Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介 一、分支语句(条件语句) ①IF语句 SPSS程序格式: IF逻辑表达式目标表达式 逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。 注:编程基本小知识: ①每句命令完成后,以点号结束,否则程序不被执行。 ②全部命令编辑完成后,以Execute.结束,否则程序不被执行. ③学会使用help——command syntax reference自学编程。 示例1:打开案例数据brain1.sav,要求将年龄小于20,性别为1(男)的病人归为第一组(group=1). GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.(目标表达式)Execute. 示例2:打开案例数据brain1.sav,要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1:将血小板大于等于100的列为组1 练习2:打开brain1.sav,创造一个新的字符型变量sex1,当sex 取值为1时,sex1取值为f, 当sex取值为2时,sex1取值为m. GET

SPSS简明教程实例及方法(相当有用)

第一章 SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下: 1. 将数据输入SPSS,并存盘以防断电。 2. 进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的 检验方法。 3. 按题目要求进行统计分析。 4. 保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下:

请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。 有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。 1.1.2 定义变量 该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。 对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 该变量定义对话框在SPSS 10.0版中已被取消,这里的操作只适合9.0~7.0版的用户。

SPSS的应用

石油行业上市公司绩效与产业整合实证分析 作者:杜刚刘慧芳时间:2007-11-21 23:57:00来源:论文天下论文网 [摘要] 本文根据多元统计学中的因子分析法,利用SPSS软件对2004年度石油行业上市公司财务指标进行了实证分析,并在此基础上对各公司经营绩效和产业整合做出分析评价。笔者认为,运用因子分析法分析财务指标不失为一种评价公司运营状况的客观方法,它为公司长期投资价值的评估和公司管理决策提供了客观依据。 [关键词] 因子分析;SPSS;绩效评价;产业整合 国际原油价格的暴涨,使得石油采掘销售行业盈利大幅增加。从2004年原油价格大幅波动至本文成稿时,国际原油期货价格已从40美元左右攀升至60美元以上,中国的石油公司亦在此轮上涨行情中获益匪浅。作为规模经济的石油行业,大企业特别是上市公司在整个行业中毋庸置疑地居于重要地位。一般而言,对于以一个利润最大化为目标的企业的评价,从财务角度入手是最为科学和客观的。本文应用因子分析法对石油行业中10家上市公司的财务指标进行了绩效评价,各项指标的计算数据来源于2005年中国证券期货业年鉴中的上市公司年报。之所以采用年报数据计算,主要是基于较季报而言,年报数据更能准确地反映公司在一个财务年度中的运营情况。投资者关注投资价值,管理者亦需要了解公司运营在同行业中所处水平。通过因子分析和各自贡献率的评价,行业中各公司的经营绩效一目了然。 一、评价指标体系的建立 本文参考上海证券交易证所公布的2005年沪市上市公司行业分类,选取了10家主营业务为石油开采与销售行业的上市公司作为分析目标变量。考虑到上市公司的治理结构和财务目标特点,本文在指标的选取上参考了财务指标评价体系,并考虑了EVA(经济剩余增加值)目标,从以下4个方面选取指标: 1.成长性指标 股份有限公司的成长的基础是公司获利能力,其根本目标是股东价值最大化。公司在成长性方面的表现,直接关系到EVA目标以及股价的市场表现。 2.盈利能力指标 盈利能力是指公司的获利能力。它以权责发生制为基础,反映了公司在经营过程中的产生的利润水平。它是衡量企业收益与资本回报的核心指标。 3.经营效率指标 经营效率反映的是公司运营中资本运作的效率问题,股东与管理者关心的中心问题也正是资金的机会成本。经营效率指标通过百分比的形式衡量管理者如何以最小的资产(现金流)获取最大的回报。 4.偿债能力指标 股东价值最大化的目标在一定程度上客观要求公司以一定比例负债经营。它一般根据股本的机会成本与借贷资金成本的比值来确定最适度的借贷杠杆规模。偿债能力指标反映了企业负债的风险水平和可续经营的能力,是衡量企业经营风险的必备指标。

SPSS原理与应用

SPSS原理与应用 一、说明 (一)课程的性质、地位和任务 SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。 (二)课程教学的基本要求 要求学生在大概了解SPSS原理的基础上,能够掌握其操作过程,进行一般的统计分析,并且能够根据结果解释、论证假设。 (三)课程教学改革 目前有关SPSS统计分析的书籍较多,但针对心理学专业教学方面的书籍几乎没有,使得教学过程中出现一些困难,如一些书上所举的例子、所练习的数据多适合医学等学科使用,和心理教育专业相差太远,所以,教学过程中,需要补充和心理学比较接近的知识,使学生能够将以前学过的知识和现在学习的内容结合起来,受到更好的效果。 二、本文 (一)课程理论教学 第一章: SPSS概览--数据分析实例详解 第一节SPSS概况 一、SPSS简介 二、操作方式: 三、缺点和不足 第二节 SPSS安装与进入 第三节 SPSS数据分析实例详解 一、数据的输入和保存 (一) SPSS的界面 (二)定义变量 (三)输入数据 (四)保存数据 二、数据的预分析 (一)数据的简单描述 (二)绘制直方图 (三)按题目要求进行统计分析 (四)导出分析结果 [重点]SPSS安装与进入 [难点] 数据的输入和保存 [教学方法] 讲授法,多媒体演示,实例讨论 [思考题]什么是SPSS

SPSS简明教程(绝对受用)

第一章SPSS概览--数据分析实例详解 数据的输入和保存 SPSS的界面 定义变量 输入数据 保存数据 数据的预分析 数据的简单描述 绘制直方图 按题目要求进行统计分析 保存和导出分析结果 保存文件 导出分析结果 希望了解SPSS 版具体情况的朋友请参见本网站的SPSS 版抢鲜报道。 例某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例) 患者: 健康人: 解题流程如下: 1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 § 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下:

请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。 有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。 1.1.2 定义变量 该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。 对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 该变量定义对话框在SPSS 版中已被取消,这里的操作只适合~版的用户。

SPSS基本功能及操作

统计分析模型 (1)信度分析文献[558] 操作步骤:分析—度量—可靠性分析(R)—移动变量到项目(I)框内—统计量—描述性(项+度量+如果。)—项之间(相关性)—继续—确定 信度系数界限值:0.60—0.65认为不可信;0.65—0.70认为是最小可接受值:0.70~0.80认为相当好;0.80—0.90就是非常好。因此,—份信度系数好的量表或问卷最好在0.80以上,0.70—0.80之间还算是可以接受的范围;分量表最好在0.70以上:0.60—0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应该考虑重新修订量表或增删题目。 项已删除的刻度 方差 删除任何题项后的Cronbach’s α系数也无显著提高。可见核心知识性员工激励组合量表的内部一致性高,信度较好。信度分析说明该问卷的整体结构设计具有较高的可信度。由此可以认为,该问卷具有较好的内在信度,依此调查得到的数据是可信的,基于该问卷进行的数据统计分析结果也是比较可靠的。

从工作满意度与员工参与的相关分析结果中可以看出,工作满意度的6个维度均与员工参与有相关关系,且都为正向相关,显著性水平均达到0.05的显著性水平,可证明薪酬激励量表具有较高的收敛效度,可以进行后续研究,他们之间的相关性也可以说明本文的研究具有一定的意义。 对比上面相关系数表,项间相关性矩阵中相关系数判别标准:》=0.1(强相关)

(3)频数分析 P66 文献[558] 操作步骤:分析—描述统计—(123)频率(F)—移动变量到变量(V)框内—显示频率表格√—统计量—分布(偏度+峰度)—继续—确定 频率也称频数,就是一个变量在各个变量值上取值的个案数。SPSS中的频数分析过程可以方便地产生详细的频数分布表,即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用的图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。描述总体分布形态的统计量主要有偏度和峰度两种。偏度(Skewness)是描述取值分布形态对称性的统计量,由Pearson在1895年提出。偏度由样本的3阶中心矩与样本方差的3/2次方的比值而得,偏度的绝对值越大,表示数据分布的偏斜程度越高。来自正态总体的样本偏度近似为0。偏度系数有两种测量方式,分别为皮尔逊偏度系数1和皮尔逊偏度系数2。偏度系数等于0的时候属于正态分布;偏度系数大于0的时候是右偏分布,表明较低的值占多数;偏度系数小于0的时候为左偏分布,表明较高的值占多数。峰度(Kutosis)是描述变量取值分布形态扁平程度的统计量,由Pearson 在1905年提出。峰度等于0的时候表示数据分布的扁平程度适中,即正态分布;峰度大于0的时候表示数据呈扁平分布;峰度小于0表明数据呈尖峰分布。 3 / 12

关于SPSS在教育统计中的应用

关于SPSS在教育统计中的应用 §1.统计处理在教育技术学研究中的作用 在科学研究活动中,要得出定量的结论,必须运用数学语言。 在现代,数学分析方法已广泛地应用到各门学科的科学研究之中,不仅在自然科学,而且在社会科学、思维科学都已普遍使用数学,处于计量化的过程,产生了计量社会学、计量历史学、计量地理学、教育统计学、教育测量学等新的计量科学。教育技术学量的研究,离不开计量化的处理,同时也需要作数学分析处理。 科学研究的计量化过程,经历过三个主要发展阶段,即从精确数学到随机数学,到现代的模糊数学。 1.经典的精确数学,如数学分析、微分方程,它是用于研究必然现象或确定性的关系,主要用于自然科学领域。 2.随机数学,如随机过程理论、数理统计,它是用来研究偶然现象,从纷乱的、大量的偶然现象中去探索必然的规律,在社会科学领域中得到广泛的应用。 3.模糊数学,如模糊集合论,它是用来研究非精确现象,现在广泛地应用于社会科学和思维科学领域。 教育技术学研究的对象是学习过程和学习资源,包含大量的偶然现象和非精确现象。因此,要深入研究教育技术现象及其规律,必须运用统计描述、统计分析方法和模糊数学分析方法,才可能使这门学科达到真正完善的地步。教育技术学研究的现象多数是偶然的现象,又称随机现象,其变化发展往往具有几种不同的可能性,究竟出现哪一种结果,那是带有偶然性的,是随机的。这类偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次数时,就能体现统计平均规律。因此,我们对数据资料作统计处理,就可以发现它们的内在规律,掌握现象的特征,检验研究的假设。在教育技术学研究中,统计处理主要包括有统计分布的描述,特征量数的计算,相关关系的分析,数量标志的统计检验,品质标志的统计检验等。 一、统计处理为教育技术学研究中的量的分析提供了支持与保障 教育技术学研究资料统计处理的对象主要是来自试验或实验中的数据。当数据表现为分数或频数这样的数量形式时,研究者通常会用适当的统计方法进行数据分析。统计分析一般和实验、准实验、调查研究的数据结果处理相联系。我们通常采用的定性研究分析是伴随着研究活动的进程而不断展开的,它的分析主要依靠归纳,而且所得结果,不是统计结果,而是一种描述、说明、解释。虽然统计分析可适用于定性研究中的部分数据分析,但它们毕竟不是定性研究中分析的主要部分。统计分析主要还是为以得到数据结果的量的研究服务的,并且由于计算机工作站和个人计算机的使用,使量的研究变得特别方便。马克思主义哲学告诉我们,世间一切事物都具有质和量两种规定性。质是事物的内在规定性,它是一切事物区别于其他事物的依据,质与事物是“直接同一”的,而且这种内在的质,又可“表现于外”,即在与其他事物的关联中表现出各种各样的“属性或特征”。量是事物所固有的、反映事物存在与发展的量方面特性的规定性(例如规模、程度、水平、速度、关系、结构比例、效率等)。这种量方面的规定性虽是客观存在地,但它与事物不具有“直接同一性”,即同一事物的量允许在一定范围内变动,而其“质”不会改变。由于事物的质与量统一于一定的“度”中,人类对事物的认识必须首先获得一定的质的认识,然后在此基础上,需要进一步去考察量,以求得对事物的“质”有更清晰、更准确的把握。这是认识的深化与精细化。只要我们对事物的量的规定性尚未达到精确程度之前,对质的认识都只能说是粗略的、不彻底的。我们认为,教育技术学研究资料统计处理的存在意义是通过对教育现象总体进行量的研究,以“量的规定性”去认识“质的规定性”。 二、统计处理为教育技术学研究提供了大量的数据与资料

相关主题