搜档网
当前位置:搜档网 › SPSS操作方法:判别分析

SPSS操作方法:判别分析

SPSS操作方法:判别分析
SPSS操作方法:判别分析

实验指导之二

判别分析的SPSS软件的基本操作

现以例9.2为例说明判别分析的SPSS操作方法:

[例9.2]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。

表9—4 1991年30个省、市、自治区城镇居民月平均收人数据

单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体)

x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入

x4:人均集体所有制工资收入 x9:个体劳动者收入

5

1. 建立数据文件

2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示:

图1 Discriminant Analysis判别分析对话框

3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。

从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。选择后点击Continue按钮返回Discriminant Analysis主对话框。

图2 Define Range对话框

4、选择分析方法

?Enter independent together 所有变量全部参与判别分析(系统默认)。

本例选择此项。

?Use stepwise method 采用逐步判别法自动筛选变量。

单击该项时Method 按钮激活,打开Stepwise Method对话框如图3所示,从中可进一步选择判别分析方法。

图3 Stepwise Method对话框

?Method栏,选择变量的统计量方法

Wilks’lambda (默认)按统计量Wilks λ最小值选择变量;

Unexplained variance :按照所有组方差之和最小值选择变量;

Mahalanobis’distance:按照相邻两组的最大马氏距离选择变量;

Smallest F ratio:按组间最小F值比的最大值选择变量;

Rao’s V按照统计量Rao V最大值选择变量。

?Criteria 选择逐步回归的标准(略)选择系统默认项。

5.单击Statistics 按钮,打开Statistics对话框如图4所示,从中指定输出

的统计量。

?Descriptives描述统计量栏

Means -各类中各自变量的均值,标准差std Dev 和各自变量总样本的

均值和标准差(本例选择)。

Univariate ANOV----对各类中同一自变量均值都相等的假设进行检

验,输出单变量的方差分析结果(本例选择)。

Box’s M --对各类的协方差矩阵相等的假设进行检验(本例选择)。

图4 Statistics对话框

?Function coefficients 选择输出判别函数系数

Fisherh’s 给出贝叶斯判别函数系数(本例选择)

Unstandardized 给出未标准化的典型判别系数

?Matrices 栏选择给出的自变量系数矩阵

Within-groups correlation 组内相关系数矩阵(本例选择)

Within-groups covariance 组内协方差矩阵

Separate-groups covariance 组间协方差矩阵

Total covariance 全部变量的协方差矩阵

6.单击Classify按钮,打开Classify对话框如图5所示:

图5 Classify对话框

?Prior Probabilities栏,选择先验概率。

All groups equal 各类先验概率相等;

Compute from groups sizes 各类的先验概率与其样本量成正比. (本例选择)

?Use Covariance Matrix 栏,选择使用的协方差矩阵

Within-groups --使用合并组内协方差矩阵进行分类(系统默认)(本例选择)

Separate-groups --使用各组协方差矩阵进行分类

?Display栏,选择生成到输出窗口中的分类结果

Casewise results 输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等(本例选择)

Summary table 输出分类的小结给出正确分类观测量数(原始类和根据判别函数计算的预测类相同)和错分观测量数和错分率(本例选择)

Leave-one-out classification 输出交互验证结果

?Plots栏,要求输出的统计图

Combined-groups 生成一张包括各类的散点图(本例选择);

Separate-groups 每类生成一个散点图;

Territorial map 根据生成的函数值把各观测值分到各组的区域图。(本例选择)

6.单击Save 按钮,打开Save对话框,见图6.

图6 Save对话框

?Predicted group membership 建立一个新变量,系统根据判别分数,把

观测量按后验概率最大指派所属的类;(本例选择)

?Discriminant score 建立表明判别得分的新变量,该得分是由未标准化

的典则判别函数计算。(本例选择)

?Probabilities of group membership 建立新变量表明观测量属于某一类

的概率。有m 类,对一个观测量就会给出m 个概率值,因此建立m 个新变量。(本例选择)

全部选择完成后,点击OK,得到输出结果如下:

Analysis Case Processing Summary 分类样本综述

Unweighted Cases N Percent

Valid 28 93.3 Excluded Missing or out-of-range group

codes

2 6.7

At least one missing

discriminating variable

0 .0

Both missing or out-of-range

group codes and at least one

missing discriminating variable

0 .0

Total 2 6.7

Total 30 100.0

Group Statistics 各类统计分析

分类Mean

均值

Std. Deviation

标准差

Valid N (listwise)

有效样本数

Unweighted Weighted

1 人均生活费收入(元/人)139.2664 23.35125 11 11.000

人均国有经济单位职工工资93.0918 11.38829 11 11.000 人均来源于国有经济单位标准工资53.9882 6.80530 11 11.000 人均集体所有制工资收入11.2073 3.44937 11 11.000 人均集体所有制职工标准工资 6.7645 2.89685 11 11.000 人均各种奖金、超额工资(国有+集体) 19.8082 5.55600 11 11.000 人均各种津贴(国有+集体) 17.8327 6.23305 11 11.000 均从工作单位得到的其他收入11.0018 2.56135 11 11.000

个体劳动者收入 1.6736 1.74528 11 11.000 2 人均生活费收入(元/人)107.3099 5.56641 11 11.000

人均国有经济单位职工工资75.9064 7.17233 11 11.000 人均来源于国有经济单位标准工资47.7536 3.42090 11 11.000 人均集体所有制工资收入9.0827 2.45900 11 11.000

人均集体所有制职工标准工资 6.0409 1.77266 11 11.000 人均各种奖金、超额工资(国有+集体) 11.2775 2.15323 11 11.000

人均各种津贴(国有+集体) 15.4375 5.11023 11 11.000

均从工作单位得到的其他收入 6.5773 1.38350 11 11.000

个体劳动者收入 1.3845 .73428 11 11.000 3 人均生活费收入(元/人)133.5150 17.11642 6 6.000

人均国有经济单位职工工资76.1700 6.06280 6 6.000 人均来源于国有经济单位标准工资44.3033 .91825 6 6.000 人均集体所有制工资收入20.3333 4.09031 6 6.000 人均集体所有制职工标准工资12.4783 3.04592 6 6.000 人均各种奖金、超额工资(国有+集体) 20.3033 5.39344 6 6.000 人均各种津贴(国有+集体) 13.2732 4.34722 6 6.000 均从工作单位得到的其他收入10.1500 2.80907 6 6.000

个体劳动者收入 1.9233 1.11631 6 6.000 Total 人均生活费收入(元/人)125.4796 22.22549 28 28.000

人均国有经济单位职工工资82.7143 12.09003 28 28.000 人均来源于国有经济单位标准工资49.4636 6.09033 28 28.000 人均集体所有制工资收入12.3282 5.36546 28 28.000 人均集体所有制职工标准工资7.7046 3.54143 28 28.000 人均各种奖金、超额工资(国有+集体) 16.5630 6.10883 28 28.000 人均各种津贴(国有+集体) 15.9147 5.54104 28 28.000 均从工作单位得到的其他收入9.0811 2.98513 28 28.000 个体劳动者收入 1.6136 1.26601 28 28.000

Tests of Equality of Group Means各类均值相等的检验

Wilks' Lambda F df1 df2 Sig.

人均生活费收入(元/人).542 10.567 2 25 .000

人均国有经济单位职工工资.506 12.226 2 25 .000

人均来源于国有经济单位标准工资.583 8.923 2 25 .001

人均集体所有制工资收入.338 24.429 2 25 .000

人均集体所有制职工标准工资.478 13.672 2 25 .000

人均各种奖金、超额工资(国有+集体) .497 12.664 2 25 .000 人均各种津贴(国有+集体) .898 1.425 2 25 .259 均从工作单位得到的其他收入.516 11.715 2 25 .000 个体劳动者收入.972 .354 2 25 .705 Pooled Within-Groups Matrices(a)

人均生活费收入(元/人)人均国

有经济

单位职

工工资

人均来

源于国

有经济

单位标

准工资

人均集

体所有

制工资

收入

人均集

体所有

制职工

标准工

人均各

种奖金、

超额工

资(国有

+集体)

人均各

种津贴

(国有+

集体)

均从工

作单位

得到的

其他收

个体劳动

者收入

Covarianc e

人均生活费收入

(元/人)

289.101 92.215 24.694 9.270 -.438 64.106 15.828 9.298 -1.158 人均国有经济单位

职工工资

92.215 79.806 23.013 -13.984 -14.104 18.999 31.151 -2.229 2.386 人均来源于国有经

济单位标准工资

24.694 23.013 23.374 -3.496 -2.063 1.925 -1.878 -5.027 -.052 人均集体所有制工

资收入

9.270 -13.984 -3.496 10.524 7.877 3.113 -7.158 1.660 -1.670 人均集体所有制职

工标准工资

-.438 -14.104 -2.063 7.877 6.469 .484 -7.895 .665 -1.611 人均各种奖金、超额

工资(国有+集体)

64.106 18.999 1.925 3.113 .484 20.020 .398 4.724 -.782 人均各种津贴(国有

+集体)

15.828 31.151 -1.878 -7.158 -7.895 .398 29.766 -.704 2.849 均从工作单位得到

的其他收入

9.298 -2.229 -5.027 1.660 .665 4.724 -.704 4.968 -.020 个体劳动者收入-1.158 2.386 -.052 -1.670 -1.611 -.782 2.849 -.020 1.683

Correlatio n

人均生活费收入

(元/人)

1.000 .607 .300 .168 -.010 .843 .171 .245 -.053 人均国有经济单位

职工工资

.607 1.000 .533 -.483 -.621 .475 .639 -.112 .206 人均来源于国有经

济单位标准工资

.300 .533 1.000 -.223 -.168 .089 -.071 -.466 -.008 人均集体所有制工

资收入

.168 -.483 -.223 1.000 .955 .214 -.404 .230 -.397 人均集体所有制职

工标准工资

-.010 -.621 -.168 .955 1.000 .043 -.569 .117 -.488 人均各种奖金、超额

工资(国有+集体)

.843 .475 .089 .214 .043 1.000 .016 .474 -.135 人均各种津贴(国有

+集体)

.171 .639 -.071 -.404 -.569 .016 1.000 -.058 .402 均从工作单位得到.245 -.112 -.466 .230 .117 .474 -.058 1.000 -.007

a The covariance matrix has 25 degrees of freedom.

Box's Test of Equality of Covariance Matrices 协方差矩阵相等的检验

The ranks and natural logarithms of determinants printed are those of the group covariance matrices.

a Rank < 6

b Too few cases to be non-singular

Test Results(a)检验结果

Tests null hypothesis of equal population covariance matrices.

a Some covariance matrices are singular and the usual procedure will not work. The non-singular groups will be tested against their own pooled within-groups covariance matrix. The log of its determinant is 17.611.

Summary of Canonical Discriminant Functions典型判别函数综述

a First 2 canonical discriminant functions were used in the analysis.

只有两个判别函数,所以特征值只有两个。判别函数的特征值越大,说明函数越具有区别力。

Wilks' Lambda判别函数检验

上表中“1through 2”表示两个判别函数的平均数在三个类间的差异情况,P值为0.000表示差异达到显著水平。

判别函数的Wilks ′ Lambda 值可以通过特征值计算: 判别函数1和判别函数2的Wilks ′ Lambda 值为

038.0)

296.31)(082.51(1

)1)(1(121=++=++λλ

判别函数2的Wilks ′ Lambda 值为

233.0)

296.31(1

)1(12=+=+λ

Standardized Canonical Discriminant Function Coefficients 标准化典型判别函数

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. * Largest absolute correlation between each variable and any discriminant function

结构矩阵结构矩阵是变量和判别函数的组内相关矩阵。

Unstandardized canonical discriminant functions evaluated at group means

Classification Function Coefficients贝叶斯判别函数的系数

分类

1 2 3

人均生活费收入(元/人).098 .157 -.026 人均国有经济单位职工工资9.355 7.816 9.743 人均来源于国有经济单位标准工资-3.303 -2.726 -4.051 人均集体所有制工资收入-5.461 -5.118 .227 人均集体所有制职工标准工资22.364 19.601 16.119 人均各种奖金、超额工资(国有+集体) -9.520 -8.357 -9.731 人均各种津贴(国有+集体) -5.260 -4.307 -6.180 均从工作单位得到的其他收入10.060 8.232 8.545 个体劳动者收入8.280 6.950 8.876 (Constant) -320.267 -228.550 -295.678

Fisher's linear discriminant functions

上表为贝叶斯判别函数的系数矩阵,可以用数学表达式表示为:

9

8

7

6

5 4

3

2

1

1

2800

.8

0598

.

10

2601

.5

5204

.9

3641

.

22 4615

.5

3032

.3

3545

.9

0978

.0

267

.

320

x

x

x

x

x x

x

x

x

y

+

+

-

-

+ -

-

+

+

-

=

9

8

7

6

5 4

3

2

1

2

950

.6

232

.8

307

.4

357

.8

601

.

19 118

.5

726

.2

816

.7

157

.0

550

.

228

x

x

x

x

x x

x

x

x

y

+

+

-

-

+ -

-

+

+

-

=

9

8

7

6

5 4

3

2

1

3

876

.8

545

.8

180

.6

731

.9

169

.

16 227

.0

051

.4

743

.9

026

.0

678

.

295

x

x

x

x

x x

x

x

x

y

+

+

-

-

+ +

-

+

-

-

=

Territorial Map分类区域图

Canonical Discriminant典型判别函数

Function 2

-6.0 -4.0 -2.0 .0 2.0 4.0 6.0

?????????????????????????????????????????????????????????????

6.0 ?211 ?

? 221 ?

? 211 ?

? 221 ?

? 211 ?

? 221 ?

4.0 ? 211 ?????

? 221 ?

? 211 ?

? 221 ?

? 211 ?

? 2211 ?

2.0 ?? 221 ? * ?? 111?

? 211 111333?

? 221 111333 ?

? 211 111333 ?

? 221 111333 ?

? 211 111333 ?

.0 ??? 221? 111333 ??

? 211 111333 ?

? 221 111333 ?

? * 21333 ?

? 23 ?

? 23 ?

-2.0 ????23 ? * ??

? 23 ?

? 23 ?

? 23 ?

? 23 ?

? 23 ?

-4.0 ??? 23 ???

? 23 ?

? 23 ?

? 23 ?

? 23 ?

? 23 ?

-6.0 ? 23 ?

?????????????????????????????????????????????????????????????

-6.0 -4.0 -2.0 .0 2.0 4.0 6.0

Canonical Discriminant Function 1

Symbols used in territorial map

Symbol Group Label

------ ----- --------------------

1 1

2 2

3 3

* Indicates a group centroid

Casewise Statistics样品分类报告

Case Number Actual

Group Highest Group概率最高的类

Second Highest Group

概率次高类

Discriminant Scores

典型判别函数得分原始类

Predicte

d Group

预测类

P(D>d |

G=g)

当样品属于

预测类但错

判其它类的

条件概率

P(G=g |

D=d)

样品属

预测类

而判断

正确的

后验概

Squared

Mahalano

bis

Distance

to

Centroid

到类中心

马氏距离

Group

P(G=g

| D=d)

后验

概率

Squared

Mahalanobis

Distance to

Centroid

到类中心的

马氏距离的

平方

Function

1

Function

2 p df

Original 1 1 1 .087 2 1.000 4.880 3 .000 39.328 1.807 3.983

2 1 1 .117 2 .595 4.286 2 .405 5.058 -.910 .799

3 1 1 .683 2 .999 .76

4 2 .001 14.980 -.111 2.238

4 1 1 .71

5 2 1.000 .671 2 .000 26.147 1.268 2.674

5 1 1 .127 2 .935 4.125 3 .065 8.261 2.113 .549

6 1 1 .334 2 .991 2.195 2 .00

7 12.215 .76

8 .566

7 1 1 .514 2 1.000 1.331 3 .000 26.655 1.620 2.795

8 1 1 .729 2 .998 .631 2 .002 13.111 .484 1.296

9 1 1 .776 2 1.000 .506 2 .000 17.596 .152 2.446

10 1 1 .998 2 1.000 .004 2 .000 19.058 .781 2.102

11 1 1 .506 2 1.000 1.362 2 .000 22.309 .184 3.073

12 2 2 .960 2 1.000 .082 1 .000 17.679 -2.161 -.995

13 2 2 .934 2 1.000 .136 1 .000 19.488 -2.732 -.677

14 2 2 .465 2 .999 1.530 1 .001 16.348 -1.317 -1.433

15 2 2 .192 2 1.000 3.300 3 .000 26.055 -2.008 -2.639

16 2 2 .978 2 1.000 .044 1 .000 20.072 -2.475 -1.071

17 2 2 .951 2 1.000 .101 1 .000 16.359 -2.102 -.829

18 2 2 .772 2 .998 .516 1 .002 13.500 -2.169 -.195

19 2 2 .178 2 1.000 3.457 1 .000 28.821 -4.144 -.178

20 2 2 .816 2 .999 .407 1 .001 13.626 -2.088 -.324

21 2 2 .931 2 1.000 .142 1 .000 21.469 -2.785 -.959

22 2 2 .816 2 1.000 .407 1 .000 16.623 -2.618 -.264

23 3 3 .686 2 .999 .754 1 .001 16.222 2.989 -1.295

24 3 3 .149 2 1.000 3.808 1 .000 23.955 4.608 -.953

25 3 3 .106 2 1.000 4.487 1 .000 42.042 5.110 -2.744

26 3 3 .377 2 1.000 1.949 2 .000 30.090 2.446 -3.406

27 3 3 .278 2 1.000 2.560 2 .000 29.211 2.277 -3.547

28 3 3 .062 2 .742 5.565 1 .198 9.420 1.014 -1.010

29 ungroup 3 .000 2 1.000 239.568 1 .000 391.883 16.317 -10.170

F u n c t i o n 2

对角线上显示的是准确预测的的个数,其余为错误预测的个数。

a 100.0% of original grouped cases correctly classified.

由上面输出结果,可以得到贝叶斯判别的函数,并在数据编辑窗口得到一个系统根据判别分数,把观测量按后验概率最大指派所属的类变量dis_1;两个由未标准化的典则判别函数计算的判别得分新变量dis1_1和dis2_1;叁个表明观测量属于某一类的后验概率建立新变量dis1_2,dis2_2, dis3_2。

SPSS主成分分析操作步骤,详细的很啊^_^==

SPSS主成分分析操作步骤,详细的很啊^_^ SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。 图表 3 相关系数矩阵

图表 4 方差分解主成分提取分析表 主成分分析在SPSS中的操作应用(3) 图表 5 初始因子载荷矩阵

从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。同理,可得到特征向量A2。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]: F 1=0.353ZX 1 +0.042ZX 2 -0.041ZX 3 +0.364ZX 4 +0.367ZX 5 +0.366ZX 6 +0.352ZX 7 +0.364ZX 8+0.298ZX 9 +0.355ZX 10

SPSS操作方法:判别分析例题

为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 5

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法 Enter independent together 所有变量全部参与判别分析(系统默 认)。本例选择此项。 Use stepwise method 采用逐步判别法自动筛选变量。

SPSS操作方法:判别分析例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 x5:人均集体所有制职工标准工资

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法

多元统计分析--判别分析SPSS实验报告

实验课程名称: __多元统计分析--判别分析___

准则判别归类,则可写成: ?? ? ??=>∈<∈) ,(),( ,),(),(,),(),(,21212211G X D G X D G X D G X D G X G X D G X D G X 当待判当当 题目:表11.5的数据包含三种鸢尾的X2=萼片宽度与X4=花瓣的宽度的观测值。对每种鸢尾有n1=n2=n3=50个观测值。 部分数据:

第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等) 散点图:图形→旧对话框→散点图,打开简单散点图子对话框;将想X2选入X轴变量,X4选入Y轴变量,将总体选入设置标记框中,点击确定。 判别分析: 步骤: 1、选择分析→分类→判别,打开判别分析子对话框。 2、选择变量“总体”,单击→,将其加入到分组变量栏中。 3、打开定义范围子对话框,最小值输入1,最大值输入3。 4、将变量“X2萼片宽度”、“X4花瓣的宽度”选入自变量栏中。选择“一起输入自 变量”的方法。 5、打开统计变量子对话框,选择均值、单变量ANOVA、Box’M、未标准化、组内协 方差、分组协方差及总体协方差,单击继续。 6、打开分类子对话框,选择不考虑该个案时的分类,其余为默认值。 7、打开保存,选择所有的变量。

相关系数矩阵a 总体萼片宽度X2 花瓣宽度X4 合计萼片宽度X2 .190 -.122 花瓣宽度X4 -.122 .581 对数行列式 总体秩对数行列式 1 2 -6.496 2 2 -6.141 3 2 -5.189 汇聚的组内 2 -5.583 检验结果 箱的M 52.832 F 近似。8.632 df1 6 df2 538562.769 Sig. .000 Wilks 的Lambda 函数检 验Wilks 的Lambda 卡方df Sig. 1 到 2 .038 477.868 4 .000 2 .809 31.075 1 .000 典型判别式函数系数 函数 1 2 萼片宽度X2 -1.987 2.680 花瓣宽度X4 5.477 .817 (常量) -.494 -9.174 非标准化系数

spss进行判别分析步骤

spss进行判别分析步骤1.Discriminant Analysis判别分析主对话框 图1-1 Discriminant Analysis 主对话框

(1)选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量), 按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。 此时矩形框下面的Define Range 按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。 图1-2 Define Range 对话框 在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue 按钮返回主对话框。 (2)指定判别分析的自变量 图1-3 展开Selection Variable 对话框的主对话框 在主对话框的左面的变量表中选择表明观测量特征的变量,按下面箭头按钮。

把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。(3)选择观测量 图1-4 Set Value 子对话框 如果希望使用一部分观测量进行判别函数的推导而且有一个变量的某个值可以作为这些观测量的标识, 则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3 所示。 并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮, 展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值, 一般均使用数据文件中的所有合法观测量此步骤可以省略。 (4)选择分析方法

SPSS操作方法:判别分析例题

SPSS操作方法:判别分析例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题] 为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方 距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x 1 :人均生活费收入 x 6 :人均各种奖金、超额工资(国有+集体) x 2 :人均国有经济单位职工工资 x 7 :人均各种津贴(国有+集体) x 3 :人均来源于国有经济单位标准工资 x 8 :人均从工作单位得到的其他收入 x 4 :人均集体所有制工资收入 x 9 :个体劳动者收入 x 5 :人均集体所有制职工标准工资 样品序地区x 1x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 类序 G 11 北京170.03110.259.768.38 4.4926.8016.4411.90.41 2 天津141.5582.5850.9813.49.3321.3012.369.21 1.05 3 河北119.4083.3353.3911.07.5217.3011.7912.00.70 4 上海194.53107.860.2415.68.8831.0021.0111.80.16 5 山东130.4686.2152.3015.910.520.6l12.149.610.47 6 湖北119.2985.4153.0213.18.4413.8716.478.380.51 7 广西134.46 98.6148.188.90 4.3421.4926.1213.6 4.56 8 海南143.79 99.97 45.60 6.30 1.56 18.67 29.49 11.8 3.82 9 四川128.05 74.96 50.13 13.9 9.62 16.14 10.18 14.5 1.21 10 云南127.41 93.54 50.57 10.5 5.87 19.41 21.20 12.6 0.90

spss进行判别分析步骤

spss进行判别分析步骤 1.Discriminant Analysis判别分析主对话框 如图1-1 所示 图1-1 Discriminant Analysis 主对话框 (1)选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量),

按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。 此时矩形框下面的Define Range 按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。 图1-2 Define Range 对话框 在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue 按钮返回主对话框。 (2)指定判别分析的自变量

图1-3 展开Selection Variable 对话框的主对话框 在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮。 把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。 (3)选择观测量 图1-4 Set Value 子对话框

如果希望使用一部分观测量进行判别函数的推导而且有一 个变量的某个值可以作为这些观测量的标识, 则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3 所示。 并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮, 展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值, 一般均使用数据文件中的所有合法观测量此步骤可以省略。(4)选择分析方法 在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是用于选择判别分

用SPSS软件来实现判别分析

哈尔滨商业大学 数学实验报告 实验题目:___用SPSS软件来实现判别分析___________ 姓名:__张彦琛_____ 学号:__2____ 专业:____数学与应用数学_____________________ 日期:______2012-10-27_______________________

一、实验目的 用SPSS软件来实现判别分析及其应用。 二、实验内容 已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为 第一个样品:x1=-8,x2=-14,x3=16,x4=56 第二个样品:x1=92,x2=-17,x3=18,x4=3.0 三、实验步骤及结论 (一)实验步骤 把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令,单击“分析—>分类—>判别”,进行操作步骤……点击确定,即可得到实验结论。(二)实验结论 表一: 检验结果a 箱的 M 35.960 F 近似。 2.108 df1 10 df2 537.746 Sig. .022 对相等总体协方差矩阵的零假设进行检验。 a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异 组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 18.794。 表一是box检验的结果。Box的检验结果是35.390,Sig.的值为0.0022<0.05,拒绝原假设,即每类的协差阵不完全相等。

表二: 表二是特征值。从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。 表三: 表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.022<0.05,拒绝原假设,检验是显著的,进而说明第一Fisher 判别函数是有效的。而第二个Sig.的值为0.985>0.05,第二Fisher 判别函数不显著,即不有效。 表四: 典型判别式函数系数 函数 1 2 x1 .010 .023 x2 .543 -.107 x3 .047 -.024 x4 -.068 .001 (常量) 9.240 -1.276 非标准化系数

判别分析实验报告 SPSS

一、实验目的及要求: 1、目的 用SPSS软件实现判别分析及其应用。 2、内容及要求 用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。 二、仪器用具: 三、实验方法与步骤: 准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS 数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型改为“数值(N)”,度量标准改为“度量(S)”,以备接下来的分析。 四、实验结果与数据处理: 表1是对各组均值是否相等的检验,由该表可以看出,在0.05的显著性水平上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,即认为除了结构效率标准指数和环境效率标准指数外,其余五个标准指数在三组的均值是有显著差异的。

表2 对数行列式 group 秩对数行列式 1 6 -33.410 2 6 -33.177 3 6 -40.584 汇聚的组内 6 -32.308 打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。 表3 检验结果 箱的 M 140.196 F 近似。 2.498 df1 42 df2 1990.001 Sig. .000 对相等总体协方差矩阵的零假设进行检验。 以上是对各组协方差矩阵是否相等的Box’M检验,表2反映协方差矩阵的秩和行列式的对数值。由行列式的值可以看出,协方差矩阵不是病态矩阵。表3是对各总体协方差阵是否相等的统计检验,由F值及其显著水平,在0.05的显著性水平下拒绝原假设,认为各总体协方差阵不相等。 1)Fisher判别法: 图一

相关主题