搜档网
当前位置:搜档网 › 探索性因子分析法.

探索性因子分析法.

探索性因子分析法.
探索性因子分析法.

SPSS探索性因子分析报告地过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 问题 题项 从未使用 很少使用 有时使用 经常使用 总是使用 1 2 3 4 5 a1 电脑 a2 录音磁带 a3 录像带 a4 网上资料 a5 校园网或因特网 a6 电子邮件 a7 电子讨论网 a8 CAI 课件 a9 视频会议 a10 视听会议 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的 那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在 第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相

探索性因子分析法.doc

探索性因子分析法(Exploratory Factor Analysis,EFA) 目录 [隐藏] ? 1 什么是探索性因子分析法? ? 2 探索性因子分析法的起源 ? 3 探索性因子分析法的计算 ? 4 探索性因子分析法的运用 ? 5 探索性因子分析法的步骤 ? 6 探索性因子分析法的优点 ?7 探索性因子分析法的缺点 ?8 探索性因子分析法的假定 ?9 EFA在教育、心理领域存在的问题及建议[1] ?10 参考文献 [编辑] 什么是探索性因子分析法? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。 [编辑] 探索性因子分析法的起源 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 [编辑] 探索性因子分析法的计算

在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行数据分析。 [编辑] 探索性因子分析法的运用 1、顾客满意度调查。 2、服务质量调查。 3、个性测试。 4、形象调查。 5、市场划分识别。 6、顾客、产品及行为分类。 [编辑] 探索性因子分析法的步骤 一个典型的EFA流程如下: 1、辨认、收集观测变量。 2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵) 3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett 球型测验、反图像协方差矩阵、KMO测度)。 4、选择提取因子法(主成分分析法、主因子分析法)。 5、发现因素和因素装货。因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表里)。 6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。 7、解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。 [编辑]

SPSS探索性因子分析的过程

SPSS探索性因子分析的过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一. 因子分析的定义

在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二. 数学模型 Z i i1F1 i2^ i3F3 …im F m U i 乙为第i个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) F m为共同因子; m为所有变量共同因子的数目; U为变量Z的唯一因素; i个变量与第im为因子负荷。(也叫因子载荷,统计意义就是第 m个公共因子的相关系数,它反映了第i个变量在第m个公共因子上的相对重要性也就是第m个共同因子对第i个变量的解释程

度。) 因子分析的理想情况,在于个别因子负荷im不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则U彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷.就是第i个原有变量和第m个因子变量间的相关系数,也就是Z在第m个共同因子变量上的相对重要性,因此,.绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于0.8,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能

探索性因子分析及其在应用中存在的主要问题

探索性因子分析及其在应用中存在的主要问题 Ξ 孙晓军ΞΞ 周宗奎 (华中师范大学心理学院,武汉,430079) 摘 要 探索性因子分析的发展非常迅速,已成为教育与社会心理学领域中最常用的统计方法之一。本文全面介绍了探索性因子分析的基本原理,阐述了其发生的机制及基本过程,对其在教育、心理领域应用中存在的问题进行了总结,并针对应用中样本容量和观测变量数目不够、因子求解方法的误用、因子数目的确定标准及因子旋转中存在的问题、因子值缺乏重复验证性、研究结果呈现形式不规范、过于依赖SPSS 、缺乏主动性等问题提出了一些相应的建议。关键词:探索性因子分析 因子旋转 因子值 因子分析(Factor Analysis )是通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(因子)来表示基本的数据结构的方法[1]。1904年,查尔斯?斯皮尔曼(Charles Spearman )在研究智力时首次采用了因子分析的方法,将因子分析方法运用于实践[2]。随后,因子分析的理论和数学基础逐步得到发展和完善,特别是50年代以后,随着计算机的普及和各种统计软件的出现,因子分析得到了巨大的发展。现在,因子分析已成为教育与社会心理学领域研究中最常用的统计方法之一。但令人遗憾的是,在实际研究的应用中,研究者并不能合理、正确的使用这一方法,导致最后的研究结果缺乏可信度。 本文的目的就是通过对探索性因子分析发生原理、步骤的详细探讨,结合其在应用中存在的问题,希望对心理领域中探索性因子分析的运用提出一些实质性的建议,包括样本大小、因子数目、观测变量数目、因 子旋转等等。 1 探索性因子分析的基本原理 探索性因子分析模型(见图1)的一般表达形式为: X 1=w 11F 1+w 21F 2+……w n1F n +w 1U 1+e 1 其中,X n 表示观测变量,F M 代表因子分析中最基本的公因子(Common factor ),它们是各个观测变量所共有的因子,解释了变量之间的相关;U n 代表特殊因子(Unique factor ),它是每个观测变量所特有的因子,相当于多元回归分析中的残差项,表示该变量不能被公因子所解释的部分;w M 代表因子负载(Factor loading ),它是每个变量在各公因子上的负载,相当于多元回归分析中的回归系数;而e n 则代表了每一观测变量的随机误差。 图1 探索性因子分析模型(来源:郭志刚,1999) 探索性因子分析的过程实质就是寻求F 1、F 2、......F m 等少数几个公因子以构建因子结构来最大限度地表示所有变量的信息[3]。在探索性因子分析中,一个重要的假设就是所 有的特殊因子间及特殊因子与公因子间是彼此独立、不相关的。 ΞΞΞ通讯作者:孙晓军,男。E 2mail :sxj -ccnu @https://www.sodocs.net/doc/868451333.html, 本研究得到国家自然科学基金资助,项目号30270473。1440 心理科学 Psychological Science 2005,28(6):1440-1442

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

SPSS探索性因子分析的过程

一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数; (标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目;

i U 为变量i Z 的唯一因素; im α为因子负荷。 (也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。 三.SPSS 中实现过程 (一)录入数据 (二)因子分析 1.在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,打开如图所示“因子分析”对话框。从原变量量表中选择需要进行因子分析的变量,然后单击箭头按钮将选中的变量选入“变量”列表中。“变量列表”的变量为要进行因子分析的的目标变量,变量在区间或比率级别应该是定量变量。分类数据(如:性别等)不适合因子分析。 2.“描述按钮”:主要设定对原始变量的基本描述并对原始变量进行相关性分析。

SPSS探索性因子分析的过程

S P S S探索性因子分析的 过程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i 在所属的那批分数中的相对位置的。)

m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关 系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子

探索性因子分析

什么是探索性因子分析法? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。 探索性因子分析法的起源 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 [编辑] 探索性因子分析和验证性因子分析的异同[1] 探索性因子分析和验证性因子分析相同之处 两种因子分析都是以普通因子分析模型作为理论基础,其主要目的都是浓缩数据,通过对诸多变量的相关性研究,可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的主要信息。图1所示即为最简单、也最为常见的因子模型,每个观测变量(指标)只在一个因子(潜变量)上负荷不为零,x1、x2、x3是潜变量ξ1的指标,x4、x5是潜变量ξ2的指标。

将图1所示的因子模型推广至一般意义上的因子模型后,各观测变量x_i与m个公共因子ξ1,ξ2,...,ξm之间的关系可以用数学模型表示如下: x1= λ11ξ1+ λ12ξ2+ ... + λ1mξm+ δ1 ...... x k= λk1ξ1+ λk2ξ2+ ... + λkmξm+ δk 其中:x i为各观测变量;ξi是公共因子;δi是x i,的特殊因子,有时也称误差项,包括x i 的唯一性因子和误差因子两部分;λij是公共因子的负载;m是公共因子ξ1,ξ2,...,ξm的个数,k是各观测变量x1,...,x k的个数,m

SPSS探索性因子分析的过程

S P S S探索性因子分析的过 程 Prepared on 22 November 2020

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i 在所属的那批分数中的相对位置的。)

m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关 系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子

验证性因子分析思路总结

目录 验证性因子分析 (1) 分析步骤 (3) (1)模型设定 (4) (2)模型拟合 (4) (3)模型修正 (6) (4)模型分析 (9) 验证性因子分析,是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。尽管因子分析适合任何学科使用,但以社会科学居多。 目前有很多软件都可以非常便利地实现验证性因子分析,本文将基于SPSSAU系统进行说明。 验证性因子分析

Step1:因子分析类型 因子分析可分为两种类型:探索性因子分析(EFA)和验证性因子分析(CFA)。 探索性因子分析,主要用于浓缩测量项,将所有题项浓缩提取成几个概括性因子,达到减少分析次数,减少重复信息的目的。 验证性因子分析与探索性因子分析相似,两者区别只在于探索性因子分析(EFA)用于探索因子与测量项之间的对应关系,验证性因子分析(CFA)用于验证结果与理论预期是否一致。 Step2:分析思路 在实际研究中,验证性因子分析常会与结构方程模型、路径分析等方法联系到一起,对于不熟悉概念的研究人员容易搞混这些方法,下表对这几种方法进行简单说明: 方法功能其它说明 探索性因子分析(EFA)研究测量关系适用于非经典量表验证性因子分析(CFA)研究测量关系适用于经典量表回归分析研究自变量对一个因变量的影响关系y为定量数据 路径分析研究多个自变量与多个因变量之间的影响关系可先用CFA/EFA确定因子与研究项关系,再进行路径分析 结构方程模型研究影响关系及测量关系结构方程模型包括两部分:验证性因子分析和路径分析

●探索性因子分析:验证因子与分析项的对应关系,检验量表效度,非经典量表通常用探 索性因子分析。 ●验证性因子分析:验证因子与分析项的对应关系,检验量表效度,成熟量表通常用验证 性因子分析。确认测量关系后,后续可进行路径分析/线性回归分析研究具体的影响关系。 ●路径分析:用于研究多个自变量与多个因变量影响关系;如果因变量只有一个,可以使 用线性回归分析。 ●结构方程模型SEM:包括测量关系和影响关系。如果仅包括影响关系,此时称作路径 分析(Path analysis,有时也称通径分析)。通常需要进行探索性因子分析和验证性因子分析,均保证测量关系无误之后,再进行结构方程模型构建。 从分析思路上看,建议先用探索性因子分析EFA构建模型,确定存在几个因子及各分析项与因子的对应关系,再用验证性因子分析CFA加以检验。 Step3:SPSSAU操作 分析步骤

探索性因子分析与验证性因子分析

探索性因子分析与验证性因子分析比较研究 湖北武汉杨丹 摘要:探索性因子分析与验证性因子分析是因子分析的两种不同形式。它们都是以普通因子模型为基础,但它们之间也存在着较大差异。本文通过对它们进行比较分析,找出其异同,并对实证分析提供一定的指导依据。 关键词:探索性因子分析、验证性因子分析、结构方程模型 现实生活中的事物是错综复杂的,在现实的数据中,我们经常遇到的是多元的情况,而不仅仅是单一的自变量和单一的因变量。因此要用到多元的分析方法,而因子分析就是其中一种非常重要的处理降维的方法。它是将具有错综复杂关系的变量(或样品)综合为少数几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类。它实际上就是一种用来检验潜在结构是怎样影响观测变量的方法。因子分析主要有两种基本形式:探索性因子分析(Exploratory Factor Analysis)和验证性因子分析(Confirmatory Factor Analysis)。探索性因子分析(EFA)致力于找出事物内在的本质结构;而验证性因子分析(CFA)是用来检验已知的特定结构是否按照预期的方式产生作用。两者之间是既有联系也有区别的,下面我们就从不同的方面进行分析比较。 一、两种因子分析的相同之处 两种因子分析都是以普通因子模型为基础的。因子分析的基本思想是通过变

量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。 如图1所示,我们假定一个模型,它表明所有的观测变量(变量1到变量5)是一部分受到潜在公共因子(因子1和因子2)影响,一部分受到潜在特殊因子(E1到E5)影响的。而每个因子和每个变量之间的相关程度是不一样的,可能某给定因子对于某些变量的影响要比对其他变量的影响大一些。 我们可以把图1的因子模型表示成线性函数: 11111221 22112222 3311322344114224 55115225 X a F a F X a F a F X a F a F X a F a F X a F a F εεεεε=++=++=++=++=++ 其中12,F F 表示两个因子,它对所有(1,2, ,5)i X i =是公有的因子,通常称为公共因子,它们的系数(1,2,,5;1,2)ij a i j ==表示第i 个变量在第j 个因子上的载 荷。 (1,2,,5)i i ε=表示第i 个变量不能被前两个因子包括的部分,称为特殊因子,通常假定2(0,)i i N εσ。

什么是探索性因子分析

什么是探索性因子分析? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。 案例:您设定了一张查询表关于用户满意对民航产业(联合航空公司,三角洲,汉莎航空公司)。您辨认30个项目描述和评估买的票的用户满意(即“空服员的休息室的检查便利”,“便利”,“环境”,“友善”,“履行的特别欲望”,“质量位子的食物在上”,“舒适”,“到来的特价优待例如飞行中电影”,“准确性”)。通过利用EFA您在您分析的过程之内可以使套30个项目降低到强调您的套项目的两三个中央因素。例如,你可以将购票的方便程度、登机检查的方便程度、候机室休憩环境、机上食品质量、座椅舒适程度、电影提供等特别服务视作潜在维度,它们是航空公司经营航空业务、提供航空服务最为重要的考量因素。此外,空服人员友好程度、特殊要求满足程度以及飞行的精确度,更似乎位于同一个流程维度。 这就是说,EFA法就是要精确找出这些变量之间的本质结构——在上述例子中,就是要找出“潜在因子”和“流程因子”。在此分析基础之上,管理人员就能够有针对性地开展市场活动,通过关注“潜在因子”或是“流程因子”,来提高旅客满意度。 探索性因子分析法的起源、历史 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind,1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 探索性因子分析法的计算、公式 在运用EFA法的时候,可以借助统计软件(如SPSS或SAS)来进行数据分析。 探索性因子分析法的运用、应用 顾客满意度调查。

因子分析方法

第七周:因子分析方法——每周一讲多变量分析分类:市场研究 | 标签:市场研究研究方法统计分析多变量分析 2010-02-11 10:58阅读(10574)评论(6) 因子分析(Factor Analysis)是一种非常有用的多变量分析技术。我想说,你要想学好多变量分析技术,一是:理解多元回归分析,二是:理解因子分析;这是多变量分析技术的两个出发点。为什么这么说呢?多元回归分析是掌握有因变量影响关系的重点,无论什么分析,只要研究的变量有Y,也就是因变量,一般都是回归思想,无非就是Y的测量尺度不同,选择不同的变形方法。而因子分析则是研究没有因变量和自变量之分的一组变量X1 X2 X3 ... Xn之间的关系。 在市场研究中,我们经常要测量消费者的消费行为、态度、信仰和价值观,当然最重要的是测量消费者的消费行为和态度!我们往往采用一组态度量表进行测量,用1-5打分或1-9打分,经常提到的李克特量表。

上面的数据是我们为了测量消费者的生活方式或者价值观什么的,选择了24个语句, 让消费者进行评估,同意还是不同意,像我还是不像,赞成还是不赞成等等,用1-9打分; 因子分析有探索性因子分析和证实性因子分析之分,这里我们主要讨论探索性因子分析!证实性因子分析主要采用SEM结构方程式来解决。 从探索性因子分析角度看: ?一种非常实用的多元统计分析方法; ?一种探索性变量分析技术; ?分析多变量相互依赖关系的方法; ?数据和变量的消减技术; ?其它细分技术的预处理过程; 我们为什么要用因子分析呢? 首先,24个可测量的观测变量之间的存在相互依赖关系,并且我们确信某些观测变量 指示了潜在的结构-因子,也就是存在潜在的因子;而潜在的因子是不可观测的,例如:真实的满意度水平,购买的倾向性、收获、态度、经济地位、忠诚度、促销、广告效果、品牌形象等,所以,我们必须从多个角度或维度去测量,比如多维度测量购买产品的动机、消费习惯、生活态度和方式等; 这样,一组量表,有太多的变量,我们希望能够消减变量,用一个新的、更小的由原始变量集组合成的新变量集作进一步分析。这就是因子分析的本质,所以在SPSS软件中, 因子分析方法归类在消减变量菜单下。新的变量集能够更好的说明问题,利于简化和解释问题。 当然,因子分析也往往是预处理技术,例如,在市场研究中我们要进行市场细分研究,往往采用一组量表测量消费者,首先,通过因子分析得到消减变量后的正交的因子(概念),然后利用因子进行聚类分析,而不再用原来的测量变量了!我想这是市场研究中因子分析的主要应用! 其实,你可以想象,例如在多元回归分析中,如果多个自变量存在相关性,如果可以用因子分析,得到几个不相关的变量(因子),再进行回归,就解决了自变量共线性问题。(理论上是这样的,但市场研究很少这么操作!) 下面是要理解的因子分析的基本概念: ?一种简化数据的技术。 ?探索性因子分析和证实性因子分析 ?因子分析就是要找到具有本质意义的少量因子。 ?用一定的结构/模型,去表达或解释大量可观测的变量。 ?用相对少量的几个因子解释原来许多相互关联的变量之间的关系。 ?描述的变量是可观测的——显在变量。 ?相关性较高,联系比较紧密的变量放在一类。 ?每一类变量隐含一个因子——潜在变量。

探索性因子分析法

探索性因子分析法(ExploratoryFactorAnalysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等情况。 一个典型的EFA流程如下: 1、辨认、收集观测变量。 2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵) 3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett球型测验、反图像协方差矩阵、KMO测度)。 4、选择提取因子法(主成分分析法、主因子分析法)。 5、发现因素和因素载荷。因素载荷是相关系数在可变物(列在表里)和因素(专栏之间在表里)。 6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。 7、解释提取的因子(例如,在上述例子中即解释为"潜在因子"和"流程因子")。折叠编辑本段特点 探索性因子分析法的优点 1、EFA法便于操作。 2、当调查问卷含有很多问题时,EFA法显得非常有用。 3、EFA法既是其他因子分析工具的基础(如计算因子得分的回归分析),也方便与其他工具结合使用(如验证性因子分析法)。 探索性因子分析法的缺点

1、变量必须有区间尺度。 2、沉降数值至少要要变量总量的3倍。 折叠编辑本段差异 探索性因子分析和验证性因子分析的差异之处 1.基本思想不同 因子分析的基本思想是要寻找公共因子,以达到降维的目的。探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相对比较大的变量的内在结构。研究者的假定是每个指标变量都与某个因子匹配,而且只能通过因子载荷凭知觉推断数据的因子结构。而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力,以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。指标变量是基于先验理论选出的,而因子分析是用来看它们是否如预期的一样。其先验假设是每个因子都与一个具体的指示变量子集对应,并且至少要求预先假设模型中因子的数目,但有时也预期哪些变量依赖哪个因子。 2.应用前提不同探索性因子分析没有先验信息,而验证性因子分析有先验信息。探索性因子分析是在事先不知道影响因子的基础上,完全依据样本数据,利用统计软件以一定的原则进行因子分析,最后得出因子的过程。 在进行探索性因子分析之前,不必知道要用几个因子,以及各因子和观测变量之间的关系。在进行探索性因子分析时,由于没有先验理论,只能通过因子载荷凭知觉推断数据的因子结构。上述数学模型中的公共因子数m 在分析前并未确定,而是在分析过程中视中间结果而决定,各个公共因子ξi统一地规定为均影响每个观测变量xi。在管理研究中,如仅仅从数据出发,很难得到科学的结果,

探索性因素分析之具体步骤探讨

探索性因素分析之具体步骤探讨文/哈工程大学应用心理 学系曹国兴 这主要针对的是预试问卷而言,也就是说在初试问卷经过了语义分析,专家讨论论证之后最终得出的问卷。以下的经验是根据我编制职业承诺问卷的基础上总结而来,错误之处希望同行指教。 首先要说的是关于样本数量的问题。按照统计学标准而言,一般样本数应为题目数的5-10倍。由于我的题目为50,故样本至少为250个。前期我计划发放样本数为6倍也就是300份,由于样本流失及废卷的原因,最终回收到有效问卷为256份,有效率为85.33%。当然这是无法避免的。 下面我主要谈一下进行探索性分析的具体步骤: 第一:比较明确的一步就是做一下关于各个项目的鉴别度(区分度)的分析。在这个条件下会删除一部分不适合的题目。删除程序为SPSS下的Analyze→Scale→Reliability Analysis。比较保险的的是从比较小的鉴别度一步一步删除,每次删一些较低的题目就看一下科隆巴赫系数的大小,直到满意为止。当然也可以直接将低于0.3的题目删除。注意的是删除的应为那些删除后科隆巴赫系数值提高的题目,如果

删除后科隆巴赫系数值降低,这就需要重新考虑了。结合语义分析取舍。 第二:在这种情况下一般而言,进行问卷设计之前所有的题目究竟是属于哪一个维度或者有几个维度应该有一定的 假设,此时应该如下操作:(1)首先是反向题目的更改。这方面需要注意的就是每次关闭文件的时候注意不要保存 或者你将反向题目更改后的文件保存下来,一定要注明,因为如果你忘记了,就会混淆到底反向题目有没有修改过。(2)也就是重点阶段。顾名思义探索性因子分析就好比你是一个探险家在探索一块未知的领域,你不知道去哪一个方向才是正确的,也许你走了很长的路却与你所期望的目的地相反。为避免在进行探索性因子分析的时候做无用功,我采用了如下的方法:在最大变异法和极大相等法两种正交旋转下分别对题目进行讨论。比如在最大变异下有四种情况:A:最大变异下不控制因素个数。B:最大变异下,强制性因素个数为3. C:最大变异下,强制性因素个数为4. D:最大变异下,强制性因素个数为5. 关于强制性因素个数的设定一般情况下为3-5个因素,当然也可以根据先前的研究理论具体分析。我们记录下四种情况下的KMO,项目共同度<0.3的题目,以及最大贡献率的情况。然后改用正交旋转下的极大相等法,同上四个情况并分别记录下来。为什么要用到极大相等法呢?这主要考虑到在最大变异的情况下第一个因素

用SPSS做探索性因子分析

DRAFT ONLY 附:在SPSS 中做探索性因子分析 1 10.12 操作步骤 2 3 第一步:载入数据并启动因子分析。 4 5 6 7 第二步:选择因子所对应的测度项。在这个研究中,我们选择对应于七个变量(包括8 自变量、因变量、与控制变量) 的测度项。 9 10 告读者丗本书的正式版丆《社会调查设计与数据分析:从立题到发表》丆 终于作为国内最好的研究方法丛书-重庆大学万卷方法丛书的一员出版了乮六2011年6月乯。有兴趣购买的读者现在可以从卓越购买。相比于意见稿丆正式版丗 - 增加了第13章丆构成性测度与PLS?C - 增加了第14章丆潜变量的调节作用 - 大量充实第15章丆论文写作与发表 - 第12章中数据分析的结果做了大量更新丆原内容介绍的方法与数据分析的结论虽然正确丆数据计算结果有错误。 其它各章也做了相当多的修改丆不再赘述。正式版比意见版的内容增加了大概三分之一。这些新增的内容对于科研人员和方法论老师来讲是十分重要。 本附录是书稿的一部分。

DRAFT ONLY 1 2 第三步:设定因子求解办法为主成分分析法。使用相关系数矩阵,并设定主要因子的 3 4 特征根大于1。 5 6 7 8 第四步:设计因子旋转方法为“Varimax”。然后在“Factor Analysis”窗口中按“ok” 开始计算。 9 10

DRAFT ONLY 1 2 10.13 主成分分析的结果 3 4 对应于27个测度项,主成分分析法一共产生了27个因子。这是可以产生的因子个数 5 的上限。“Total ”列报告了每一个因子所对应的特征值。“% of Variance ”表示这个特征 6 值在所有特征值和中的比例。“Extraction Sums of Squared Loadings ”这一列反映了特征根 7 大于1的因子。在这个例子中,我们顺利地得到了7个因子。相应地,在用碎石坡法对因 8 子进行目测时,我们得到的结果是一致的。请读者参看本章中的相应图例。值得一提的 9 是,第八个因子的特征根为0.967,十分接近1。如果这个研究的理论因子个数是8个,研10 究者也可能考虑手工设定所要抽取的因子个数 (见第三步界面)。 11

相关主题