搜档网
当前位置:搜档网 › 软件开发人员的薪金

软件开发人员的薪金

软件开发人员的薪金
软件开发人员的薪金

软件开发人员的薪金

摘要

本文所要解决的是研究软件开发人员的薪金与他们的资历、管理责任、教育程度等之间的关系,建立一个模型,以便分析公司人事策略的合理性,并作为新聘人员薪金的考虑。根据题设条件,结合实际情况,建立线性回归模型,方程表达式:

011223344=+++++y a a x a x a x a x ε

其中0a ,1a ,2a ,3a ,4a 是回归系数,ε 为随机误差,1x ,2x ,3x ,4x 分别为资历、管理水平和教育程度。结合题目所给的数据,运用matlab 软件的命令rearess ,求出了软件开发人员的薪金与资历、管理水平、教育水平之间的线性回归方程:

1234=11300+546+6883-2994+148+y x x x x ε

分析后同时运用残差分析法发现模型的缺陷,改进影响软件开发人员薪金的因素,改变模型,使得管理责任因素和教育程度因素对薪金是交互作用的,这样合理化模型后,得出了影响软件开发人员薪金因素的最佳多元回归模型。建立回归方程:

011223344523632=+++++++y a a x a x a x a x a x x a x x ε

并用运用matlab 软件得出了该模型的较准确的解:

12342342=11204+497+7048-1727-348-3071+1836+y x x x x x x x x ε 并对回归方程和各个因素运用残差分析法进行了显著性检验,去掉异常数据后,在运用matlab 软件求解,得出更为准确的解:

ε++++=4232432199713056-356-1737-704149811200x x x x x x x x y

再次运用残差分析法对模型进行检验,说明模型可用。

综上所述,本文对数据进行深入分析,运用MATLAB软件画图,制作表格,更形象地反映数据,简单明了,运用残差分析法对模型进行检验,说明模型可用。

关键字:线性回归模型ressess 残差分析法

一.问题重述

一家高技术公司人事部门为研究软件开发人员的薪金与他们的资历、管理责任、教育程度等之间的关系,要建立一个模型,以便分析公司人事策略的合理性,并作为新聘用人员薪金的参考。他们认为目前公司人员的薪金总体上是合理的,可以作为建模的依据,于是调查了46名软件开发人员的档案资料,如表,其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高程度(研究生)。

二.模型假设

(1)薪金自然随着资历(年)的增长而增加;

(2)管理人员的薪金应高于非管理人员;

(3)教育程度越高薪金也越高;

(4)管理责任、教育程度、资历诸因素之间没有交互作用;

(5)资历(年)、管理水平、教育程度分别对薪金的影响是线性的;

(6)目前公司软件开发人员的薪金是合理的;

(7)在模型改进中我们假设资历(年) 、管理水平、教育程度之间存在交互作 用 。

三.问题的分析

对于问题,在符合题意并且与实际情况较吻合的情况下,薪金记作y ,资

历(年)记作1x ,为了表示是否非管理人员,定义

为了表示3种教育程度,定义 ,

这样,中学用3x =1,4x =0来表示,大学用3x =0,4x =1表示,研究生则用3x =0,

4x =0表示。

对于影响变量的这些定性因素(管理,教育),在模型求解过程中我们采用“0-1”变量来处理,并运用数学软件matlab 来求解,最后对所得的解进行讨论和分析。

四.模型的建立及求解

1. 符号的说明:

y

软件开发人员的薪金 1x

资历 2x

管理责任 3x ,4x

教育程度

i a

带估计的回归系数(i=1,2,3,4,5,6)

2.模型的建立

薪金y 与资历1x ,管理责任2x ,教育程度3x ,4x 之间的多元线性回归方程为:

011223344=+++++y a a x a x a x a x ε

3.模型的求解

直接利用matlab 统计工具箱中的命令regress 求解,使用格式为:

[b,bint,r,rint,stats]=regress(y,x,slpha)

其中输入y 为模型(1)中的y 的数据(n 维向量,n=30),x 为对应于回归系数i a 的数据矩阵,alpha 为置信区间α;输出b 为i a 的估计值,bint 为b 的置信区间,r 为残差向量,rint 为r 的置信区间,stats 为回归模型的检验统计量,有四个值,

第1个是回归方程的决定系数2

R (R 是相关系数),第2个是F 统计量值,第3个是与F 统计量值对应的概率值p ,第4个是剩余方差2

s 。

根据上述方程式,我们用数学软件matlab 对模型进行求解 可以得到回归系数及其置信区间(置信水平α=0.05),检验统计量2

R ,F ,p ,2

s 的结果,见

表二。

表二 模型(1)的计算结果

五.结果分析和检验

一.结果分析

从表二知2

R =0.975,即因变量(薪金)的95.7%可由模型确定,F 值远远超过F 的检验的临界值,p 远小于α,因而模型(1)从整体来看是可用的。比如,利用模型可以估计(或预测)一个大学毕业,有2年资历,费管理人员的薪金为:

0112233441=+++++y a a x a x a x a x ε=12272

模型中各个回归系数的含义可初步解释如下:1x 的系数为546,说明资历增加1年薪金增长546 ;2x 的系数为6883,说明管理人员薪金多6883 ;3x 的系数为-2994,说明中学程度薪金比更高的少2994 ;4x 的系数为148,说明大学程度薪金比更高的多148 ,但是注意到4a 置信区间包含零点,说明这个系数的解释

不可靠。

需要指出,以上解释是就平均值来说,并且,一个因素改变引起的因变量的变化量,都是在其他因素不变的条件下成立的。

二.结果检验

a的置信区间包含零点,说明基本模型(1)存在缺点。为了寻找改进的方4

向,常用残差分析方法(残差ε指薪金的实际值y与用模型估计的薪金y1之差,是模型(1)中随机误差ε的估计值,这里用了一个符号)。我们将影响因素分成资历与管理-教育组合两类,管理-教育组合的定义如表三:

表三管理——教育

组合123456

管理010101

教育112233为了对残差进行分析,图1给出了ε与资历x1的关系,图2给出ε与管理x2-教育x3,x4组合间的关系。

图1 模型(1)ε与1x的关系图2模型(1)ε与2x—3x,4x组合

的关系

相关主题