SPSS、Python员工满意度问卷调查激励保健理论研究:决策树、随机森林和AdaBoost|附代码数据

全文链接:https://tecdat.cn/?p=37293 

原文出处:拓端数据部落公众号

在深入了解公司当前的实际情况和员工内心真实想法的基础上,我们旨在从专业视角出发,为企业在组织管理方面的不足进行诊断,并进行全面审视。

为了更好地规划公司未来的发展方向,综合管理部特别组织了这次员工满意度调查。通过分析结果帮助我们通过图表直观展示了不同岗位、年龄段的员工满意度,并探究了影响满意度的多种因素。此外,我们还进行了信度检验,确保了问卷结果的可靠性,并应用了统计学方法对不同工龄和岗位的满意度进行了差异性分析。

我们还基于激励保健理论,使用决策树、随机森林和AdaBoost模型对员工满意度进行了深入分析,并可视化了模型的结果和误差。

本研究在方法的运用、数据的处理以及结论的得出等方面,都进行了全面且深入的探讨。期望这一研究成果不仅能够为当前的学术讨论增添新的视角,也能够为那些在相似研究方向上摸索的人士提供有价值的思路和指引。

 

1.问卷概况 

问卷采用现场随机抽样方式发放,现场回收,问卷发放对象为有网上购物经历的受访者。问卷发放135份,回收135份,回收率100%。回收问卷中有效问卷135分,有效回收率100%

满意度问卷:

 

 

问卷数据用手工录入,用Excel和SPSS工具进行分析。本分析报告是在分析结果的基础上撰写而成的。

 

探索性可视化

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 读取Excel文件
file_path = '/mnt/data/data.xlsx'
df = pd.read_excel(file_path)

# 检查数据的前几行以了解其结构
df.head()

import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.font_manager import FontProperties

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 准备数据
df.head()

# 基本可视化:条形图、饼图、散点图
# 条形图:展示不同岗位的平均满意度
plt.figure(figsize=(10, 6))
sns.barplot(x='岗位', y='满意度公式:\nsum(F2:O2)/50', data=df)
plt.title('不同岗位的平均满意度')
plt.xlabel('岗位')
plt.ylabel('平均满意度')
plt.show()

# 饼图:展示不同年龄组的比例
age_counts = df['年龄'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(age_counts, labels=age_counts.index, autopct='%1.1f%%')
plt.title('不同年龄组的比例')
plt.show()

# 散点图:展示年龄与满意度的关系
plt.figure(figsize=(10, 6))
sns.scatterplot(x='年龄', y='满意度公式:\nsum(F2:O2)/50', data=df)
plt.title('年龄与满意度的关系')
plt.xlabel('年龄')
plt.ylabel('满意度')
plt.show()

# 将工龄转换为类别型数据,以便在散点图中使用不同的颜色
df['本企业工龄'] = df['本企业工龄'].astype('category')

# 绘制散点图,使用不同的颜色表示不同的工龄
plt.figure(figsize=(10, 6))
palette = {category: color for category, color in zip(df['本企业工龄'].cat.categories, colors)}
sns.scatterplot(x='年龄', y='满意度公式:\nsum(F2:O2)/50', hue='本企业工龄', data=df, palette=palette)
plt.title('年龄、工龄与满意度的关系')
plt.xlabel('年龄')
plt.ylabel('满意度')
plt.legend(title='工龄')
plt.show()

 

 

 

 

  1. 条形图:展示了不同岗位的平均满意度,每个岗位使用了不同的颜色。
  2. 饼图:显示了不同年龄组的比例,每个年龄组使用了不同的颜色。
  3. 散点图:揭示了年龄与满意度之间的关系,不同年龄组使用了不同的颜色。

 

2. 受访人群社会属性统计分析

2.1 年龄分析

              表2.1年龄构成

年龄

平均值项:满意度

年龄

平均值项:满意度

年龄

35-50

76.00%

35-50

76.00%

35-50

35岁-50岁

81.21%

35岁-50岁

81.21%

35岁-50岁

35岁以下

77.48%

35岁以下

77.48%

35岁以下

50岁以上

90.00%

50岁以上

90.00%

50岁以上

年龄

平均值项:满意度

年龄

平均值项:满意度

年龄

35-50

76.00%

35-50

76.00%

35-50

图2.1 年龄构成

受访者的年龄在35岁以下的占69%,35-50岁以下占21% 。由此可见,受访员工主要以中青年为主。

受访者的年龄在35岁以下的占69%,35-50岁以下占21% 。由此可见,受访员工主要以中青年为主。

2.2 岗位分析

              表2.2 岗位构成

岗位

计数项:人数

保洁

16

工程

12

管理

24

客服

76

绿化

1

秩序

5

总计

134

图2.2 岗位构成

岗位构成中。“绿化”最多,占50%,其次是“客服”和“管理”,各占28%和9%。

3. 受访员工指标单因素分析

3.1 职位分析

                     表3.1 职位构成

行标签

计数项:人数

员工

70

主管

41

助理经理及以上

23

总计

134

按职位统计,人数最多的是“员工”占52%,其次为“主管”占31% 。

3.3 工龄分析

              表3.3工龄构成

行标签

计数项:人数

1-3

48

1年以下

58

3年以上

27

 

按工龄统计,受访人群人数最多的是“15-20万元”组,其次为“10-15万元”组。这两组人数合计占总人数的51.7%。说明岗位满意度人群以收入偏高人群为主。

3.4 职位分析

              表3.4工龄构成

行标签

计数项:人数

1-3

48

1年以下

58

3年以上

27

 

按工龄统计,受访人群人数最多的是“15-20万元”组,其次为“10-15万元”组。这两组人数合计占总人数的51.7%。说明岗位满意度人群以收入偏高人群为主。

3.5 问卷的信度检验

以上分析的问题1-9都属于问卷的客观性问题,下面开始对问卷的主观性问题10-15进行分析。在分析主观性问题以前,需要对问卷的主观性问题用Cronbach’s α信度系数进行信度检验。

1. 首先介绍用手工方式计算Cronbach’s α信度系数。用Excel“数据分析”中的“协方差”工具或者用Excel协方差函数COVAR(var1,var2) 计算问题10-问题15数据的协方差,计算结果如下表:

案例处理汇总

N

%

案例

有效

132

99.2

已排除a

1

.8

总计

133

100.0

a. 在此程序中基于所有变量的列表方式删除。

可靠性统计量

Cronbach's Alpha

项数

.736

11

其中对角线上的数值是每个问题数据的方差。

6 满意度认知分析

       表3.6 满意度认知频数

年龄

平均值项:满意度

35-50

76.00%

35岁-50岁

81.21%

35岁以下

77.48%

50岁以上

90.00%

 

图3.6 满意度认知频数

 35-50岁员工认为工作满意的占76%。  50岁以上员工认为工作满意的占90%。 。说明大部分网满意员工是老员工,因此选择留在公司。

3.7 满意度岗位分析

       表3.7 岗位满意度最大风险来源均值统计

年龄

平均值项:满意度

员工

76.34%

主管

78.98%

助理经理及以上

82.61%

 

图3.7岗位满意度 条形图

助理经理及以上员工认为工作满意的占82.61%员工认为工作满意的占76.34%%。 。说明大部分网满意员工是高级别职位的员工,同时他们有较高的权利,因此职位满意感也较高。

4. 受访员工多因素交叉分析

4.1 不同年龄人群岗位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的岗位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.1 不同年龄人群岗位满意度比较

岗位* 年龄 交叉制表

百分比

年龄

合计

35-50

35-50

35岁以下

50岁以上

岗位

保洁

1.4

3.3

11.1

.1

16.0

工程

1.1

2.5

8.3

.1

12.0

管理

2.1

5.0

16.7

.2

24.0

客服

6.8

15.9

52.7

.6

76.0

绿化

.1

.2

.7

.0

1.0

秩序

.4

1.0

3.5

.0

5.0

合计

12.0

28.0

93.0

1.0

134.0

 

图4.1 不同年龄受访员工次数百分比柱形图

不同年龄受访员工次数百分比柱形图更能说明两者满意度的差异。从结果来看,客服中满意度最高的是35岁以下员工。而工程岗位中,满意度最高的是35-50岁员工,说明不同岗位和不同年龄段的员工的满意度是有差异的。

4.2 不同年龄人群职位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.2 不同年龄人群职位满意度比较

  * 年龄 交叉制表

年龄

合计

35-50

35-50

35岁以下

50岁以上

 

员工

期望的计数

6.3

14.6

48.6

.5

70.0

  中的 %

1.4%

1.4%

97.1%

.0%

100.0%

主管

期望的计数

3.7

8.6

28.5

.3

41.0

  中的 %

22.0%

39.0%

36.6%

2.4%

100.0%

助理经理及以上

期望的计数

2.1

4.8

16.0

.2

23.0

  中的 %

8.7%

47.8%

43.5%

.0%

100.0%

合计

期望的计数

12.0

28.0

93.0

1.0

134.0

  中的 %

9.0%

20.9%

69.4%

.7%

100.0%

图4.2 不同年龄受访员工次数百分比柱形图

不同年龄受访员工次数百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是35岁以下员工。而主管职位中,满意度最高的是35-50岁员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

4.3 不同工龄人群职位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.3 不同工龄人群职位满意度比较

  * 本企业工龄 交叉制表

本企业工龄

合计

1-3

1年以下

3年以上

 

员工

期望的计数

25.6

30.3

14.1

70.0

  中的 %

30.0%

70.0%

.0%

100.0%

主管

期望的计数

15.0

17.7

8.3

41.0

  中的 %

43.9%

14.6%

41.5%

100.0%

助理经理及以上

期望的计数

8.4

10.0

4.6

23.0

  中的 %

43.5%

13.0%

43.5%

100.0%

合计

期望的计数

49.0

58.0

27.0

134.0

  中的 %

36.6%

43.3%

20.1%

100.0%

图4.3 不同工龄人群职位满意度百分比柱形图

不同工龄人群职位满意度百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是1年以下员工。而主管职位中,满意度最高的是1-3年员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

4.4 不同工龄人群岗位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.4 不同工龄人群岗位满意度比较

岗位* 本企业工龄 交叉制表

本企业工龄

合计

1-3

1年以下

3年以上

岗位

保洁

期望的计数

5.9

6.9

3.2

16.0

岗位 中的 %

50.0%

12.5%

37.5%

100.0%

工程

期望的计数

4.4

5.2

2.4

12.0

岗位 中的 %

41.7%

8.3%

50.0%

100.0%

管理

期望的计数

8.8

10.4

4.8

24.0

岗位 中的 %

29.2%

25.0%

45.8%

100.0%

客服

期望的计数

27.8

32.9

15.3

76.0

岗位 中的 %

32.9%

64.5%

2.6%

100.0%

绿化

期望的计数

.4

.4

.2

1.0

岗位 中的 %

.0%

.0%

100.0%

100.0%

秩序

期望的计数

1.8

2.2

1.0

5.0

岗位 中的 %

80.0%

.0%

20.0%

100.0%

合计

期望的计数

49.0

58.0

27.0

134.0

岗位 中的 %

36.6%

43.3%

20.1%

100.0%

图4.4 不同工龄人群岗位满意度比较 百分比柱形图

不不同工龄人群岗位满意度比较百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是1年以下的客服员工。而管理职位中,满意度最高的是3年以上工龄员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

5. 不同人群满意度差异分析

不同工龄满意度是否有显著性差异,不同收入的人群满意度是否有显著性差异,这些都是值得研究的问题。根据本次问卷调查的数据,采用统计学假设检验的方法,分别对不同工龄满意度做以下假设检验。

利用以上数据,分别对不同工龄满意度次数进行以下假设检验:

5.1 不同工龄满意度次数的假设检验。

利用数据透视表工具,可以得到不同年龄满意度次数的以下统计数据:

案例处理摘要

案例

已包含

已排除

总计

N

百分比

N

百分比

N

百分比

满意度公式:sumF2:O2)/50  * 本企业工龄

135

75.4%

44

24.6%

179

100.0%

报告

满意度公式:sumF2:O2)/50

本企业工龄

均值

N

标准差

18:46:25.433

1

.

1-3

18:24:58.776

49

2:54:03.886

1年以下

18:40:13.241

58

3:12:31.892

3年以上

19:38:40.000

27

3:14:20.193

总计

18:46:25.433

135

3:06:14.139

ANOVA a

平方和

df

均方

F

显著性

满意度公式:sumF2:O2)/50 * 本企业工龄

组间

(组合)

3.544E8

3

1.181E8

.945

.421

组内

1.638E10

131

1.250E8

总计

1.673E10

134

a. 分组变量 本企业工龄 是字符串,因此无法计算线性检验。

相关性度量

Eta

Eta

满意度公式:sumF2:O2)/50 * 本企业工龄

.146

.021

原假设H0:不同工龄满意度无差别

备选假设H1:不同工龄满意度有差别

这是一个两样本均值左尾t检验。

  由于t>左临界值,没有落入拒绝域,因此接受原假设,接受备选假设。即不同工龄满意度是没有显著性差别的。

5.2 不同工龄人群满意度的方差分析

利用spss进行方差分析:

ANOVA

满意度公式:sumF2:O2)/50

平方和

df

均方

F

显著性

组间

5.849E9

5

1.170E9

13.865

.000

组内

1.088E10

129

8.436E7

总数

1.673E10

134

由于F>F crit,五个不同工龄组的受访员工的满意度有显著性差异。

5.3 不同岗位人群满意度的方差分析

利用spss进行方差分析:

ANOVA

满意度公式:
sumF2:O2)/50

平方和

df

均方

F

显著性

组间

1.064E10

4

2.659E9

56.287

.000

组内

6.094E9

129

4.724E7

总数

1.673E10

133

由于F>F crit,五个不同岗位组的受访员工的满意度有显著性差异。

6.激励保健理论分析 

首先,我将基于激励保健理论分析该公司员工的满意度数据。激励保健理论主要关注两个方面:激励因素和保健因素。激励因素是促使员工满意和激励的工作因素,如成就、认可和工作本身的挑战性。保健因素是防止员工不满意的工作因素,如公司政策和管理、薪酬、工作条件和同事关系。

我将使用数据分析方法来探索这些因素与员工满意度之间的关系。然后,我将可视化模型的结果和误差,并输出模型参数。

尝试使用数据中的其他相关列来分析员工满意度。例如,我可以探索员工的年龄、工龄、岗位等因素与满意度之间的关系。 

 

可视化了结果:

  1. PCA结果:展示了数据的主成分分析结果。每个点代表一个样本,其在图中的位置由两个主成分决定。颜色表示满意度得分。
  2. 模型误差:展示了决策树模型的预测误差。每个点代表一个样本,其在图中的位置由实际满意度得分和预测误差决定。

 

 

7.随机森林、决策树和AdaBoost模型

使用随机森林、决策树和AdaBoost模型对数据进行分析。然后,我将可视化这些模型的结果和误差,并输出模型参数。

 

 

 

 树状图和变量重要度

 

 

现在,我已经成功地训练了随机森林、决策树和AdaBoost模型,并生成了所需的图表:

  1. 第一个图表展示了决策树模型的树状图。
  2. 第二个图表展示了特征的重要性,这里仅展示了前10个特征的重要性。

根据提供的两个图像:

  1. 特征重要性图表(随机森林模型):

    • 这个图表展示了在随机森林模型中,不同特征对预测员工满意度的重要性。特征重要性是通过评估每个特征在模型中的预测能力来确定的,通常通过减少模型精度来衡量特征的缺失对预测结果的影响。

    • 图表中的条形可能表示了不同特征的重要性得分。得分越高,特征在预测满意度时的重要性越大。

    • 例如,如果“岗位”特征在图表中具有较高的重要性得分,这表明它在决定员工满意度方面起着关键作用。

  2. 决策树模型:

    • 决策树模型通过一系列的问题将数据分割成不同的组,以便预测员工的满意度。每个节点代表一个特征的分割点,而每个叶节点代表最终的预测结果。

    • 根据提供的图像,我们可以看到“岗位_客服”、“职位_主管”和“职位_助理经理及以上”是决策树中用于预测满意度的关键特征。

    • 例如,“岗位_客服”的Gini指数为0.499,表示在这个节点上,数据集的不纯度较高,意味着客服岗位的员工满意度可能比较混合。而“职位_主管”和“职位_助理经理及以上”的Gini指数较低,表明这些特征能够提供更清晰的分割,使得预测结果更为准确。

结合两个模型的分析,我们可以得出以下结论:

  • 岗位类型(如客服、管理、技术等)对员工满意度有显著影响。特别是客服岗位,可能需要更多的关注来提高员工满意度。

  • 职位级别(如主管、助理经理及以上)也是影响满意度的一个重要因素。高级职位的员工可能因为更多的职责和权力而感到更满意。

  • 随机森林模型可能揭示了多个特征的相对重要性,而决策树则展示了如何通过这些特征的特定阈值来做出预测。

最终,这些分析结果可以帮助公司了解哪些因素对员工满意度最为关键,并据此制定相应的人力资源策略和改善措施。

 

8. 本次受访员工问卷调查的总结和回顾

本次受访员工问卷调查获取了受访人群基本信息、受访人群受访员工的主要指标,分析了年龄因素、岗位因素、岗位级别因素对岗位满意度行为的影响,并重点测试了这些因素的变化如何影响他们对满意度的认识,得到了一系列有意义的结论。本次问卷调查基本上实现了预定的目标。

本次问卷调查也有一些问题,需要进一步改进。

1. 问卷数量只有135份,数量还不够大,导致交叉分析时每一种组合的样本数比较少,结论带有偶然性。如果需要进一步分析,需要进行更大规模的问卷调查,使得结论更加具有科学性和稳定性。

2. 根据本次问卷调查获取的数据,还可以进行更多的统计分析,例如不同年龄满意度的差异和比较分析等,由于时间关系没有进一步展开。

3. 问卷的设计还有不足。如果在问卷中设计更多的定比变量,以便对这些变量进行求和、平均值等交叉统计,调查的统计方法会更多样,结论会更丰富。

参考文献

[1]潘思宇,杨丽君.中小企业员工信任关系如何改善[J].人力资源.2020,(16).
[2]梁青青.弹性福利优化与员工满意度提升研究[J].技术经济与管理研究.2019,(2).DOI:10.3969/j.issn.1004-292X.2019.02.020 .
[3]马云骁,汪泽宇,余丽霞.宏观审慎政策背景下商业银行防范风险的对策研究[J].现代经济信息.2019,(22).
[4]刘进,冼灿玲,刘承恺,等.产业升级背景下制造企业员工离职倾向的影响因素分析[J].当代经济.2019,(7).DOI:1

  • 7
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值