主成分分析碎石图_临床科室科研绩效与人员构成的主成分回归分析

本文探讨临床科室科研绩效与人员构成的影响因素,使用主成分回归法发现博士学位、中级职称、40周岁以上人员及博士生导师是关键影响因素,建议构建以博士生导师为首的人员结构以提升科研绩效。
摘要由CSDN通过智能技术生成

中华医学科研管理杂志, 2020,33(02) 张丹鹿, 王琪..  

摘要 目的

探究临床科室科研绩效人员构成的影响因素及其影响程度,为优化临床科室人员结构,促进医院科研业绩提升提供参考依据。

方法

回顾性分析2017年度某医院75个临床科室科研绩效评分及人员整体构成。用主成分回归法分析临床科室科研绩效与人员构成的关系。

结果

KMO统计量为0.635,P<0.001,模型有统计学意义。4个公因子分别为:中年女性、青年硕士、正高级职称者及硕士生导师、博士及博士生导师,累计方差贡献率87.19%。博士学位(β=124.164)、中级职称(β=123.573)、年龄≥40周岁(β=102.149)及博士生导师(β=95.309)是影响临床科室科研绩效最重要的4个影响因素。

结论

公因子数量的选择应结合多项判定标准及专业意义综合考虑。构建一个以博士生导师带头、中级中青年人员为基础、博士学位人员为骨干的人员队伍结构,有利于临床科室科研绩效的提升。

随着国家《"十三五"国家科技创新规划》和《"健康中国2030"规划纲要》等一系列战略部署的实施,科技创新与发展已经占据卫生健康领域的重要地位。大型综合医院承担着越来越多的科学研究任务与指标,在临床医学科研中逐渐成为核心角色[]。科研绩效指标对医院绩效评价的重要性显著提升。有文献研究表明,科研人力资源对临床科室科研绩效有重要影响[],但对人员的构成、影响程度等因素缺少进一步的分析与说明。本研究即从人员构成的角度,使用主成分回归法分析临床科室科研绩效的主要影响因素与影响程度,为科研管理者进一步优化临床科室人员结构,促进医院科研业绩提升提供借鉴依据与理论。此外,本研究也就主成分回归在条件判断标准相冲突的情况下公因子数量的选择等提供实践参考。

资料与方法 1.1 研究对象

回顾性分析2017年度某高校附属医院主院区75个临床科室科研效益评分。各项科研指标评分标准参照医院《临床科室科研绩效评估办法》。人员信息数据来自于2017年度医院职工名册,包括75个临床科室共计987名正式在职的医师、技师及药师人员。

1.2 变量设置

以往文献对科研绩效评价体系有较为全面的研究,总结出科研绩效指标基本包括课题、论文、专利、著作、科技奖励及学术交流等[]。本研究中,科室科研绩效评分即为上述科研指标结合医院《临床科室科研绩效评估办法》对各指标的权重累计相加而得。变量具体设置如下:因变量Y为科室科研绩效总分。将科室人员构成的6类17个指标纳入自变量(X),即:性别(男X1、女X2);年龄(<40周岁X3、≥40周岁X4);工作年限(工作<5年X5、工作6~15年X6、工作>15年X7);学位(学士及以下X8、硕士X9、博士X10);职称(初级及以下X11、中级X12、副高级X13、正高级X14);硕博导师(硕导X15、博导X16、非硕博导X17)。全部自变量均为频数统计的连续型变量。

1.3 主成分回归分析

当自变量指标较多时,一方面自变量间可能存在多重共线性,直接使用回归分析,结果可能偏离实际情况[];另一方面,对多个指标的共同重要信息进行提取及降维,也可以在保证数据解释力度的同时实现有效信息的综合及重叠信息的去除[]。因此,本研究在使用因子分析进行降维并提取公因子后,再进行主成分回归分析。

因子分析是通过多个自变量间相关系数矩阵的内部关联,找出能综合所有变量主要信息的少数公因子,进而代替所有变量进行研究分析[]。变量间的偏相关性检验是因子分析效果的重要衡量指标。KMO检验统计量在0.5以下时,不适用因子分析法。特征根是主成分影响力度的指标,一般来说,特征根大于1,主成分解释力度较好。方差贡献率越高,表明主成分携带的自变量原始信息越多。对应的累计贡献率即为方差贡献率从高到低的前k个主成分提取的原始信息。通常该指标达到85%以上表明主成分包含全部指标的主要信息。

1.4 公因子提取方法

提取的公因子应具有实际意义。在实际应用中,对于某些特征根小于1,但专业上有明确含义的公因子,可结合累计贡献率、碎石图等综合考虑予以保留,以达到特定研究目的[]。在某些情况下,样本进行因子分析后无法得到KMO检验结果,出现相关矩阵为非正定矩阵的情况。可能的原因是结果中一些特征值过小(非常接近于0)或者为负值,不满足正定矩阵的充分必要条件。这些变量方差贡献率极低,意味着携带的原始信息量极少,在不影响模型整体意义的前提下,可以考虑做变量删除处理。为了使因子载荷矩阵中系数更加明显,从而使公因子有更强的解释意义,需要对因子载荷矩阵进行方差最大正交旋转,得到更易解释的公因子[]

提取公因子后,可进行主成分回归分析,并结合成分系数矩阵将公因子计算公式代入标化的主成分回归方程,再将标化变量的计算公式代入,最终得到原始变量的回归系数方程。通过主成分回归还原变量的形式,模型消除了共线性,增强了解释力度,分析结果更为可靠[]

本研究使用SPSS 20.0进行计算分析。

结果 2.1 临床科室科研绩效评分及医院人员构成整体情况

2017年医院主院区75个临床科室科研绩效平均得分为920分。各科室间分数差距显著,两极分化明显。其中,科室最高得分5 470分,最低得分0分。总分1 000分及以上的科室26个,占比34.7%;得分300分及以下的科室24个,占比32.0%。

医院人员结构总体上仍以青年女性人员为主(女性:57.95%;<40周岁:59.47%;工作<5年:42.15%),硕士及低职称占比显著(硕士:61.50%;初级及以下职称:45.59%),硕博导师比例较低(硕导:16.62%;博导:2.13%)。

2.2 临床科室科研绩效评分与医院人员构成的主成分回归

首次对样本进行主成分回归分析,结果显示:相关系数矩阵不是正定矩阵,KMO检验无法进行。查看自变量初始特征值可以发现,其中5个自变量(X1,X7, X8, X11,X17)特征值(-4.83E-16至4.03E-16)远小于其它自变量,且特征值为负数或极其接近于0。上述自变量方差贡献率极低且可能存在共线性,考虑筛除。

筛除后,对剩余12个自变量重新进行因子分析,结果显示:KMO统计量为0.635,Bartlett的球形度检验P<0.001,具有统计学意义,说明变量间存在相关性,可以进行因子分析提取公因子。变量特征值与方差贡献率如表1所示,初始特征值中前3个主成分特征根均大于1。因子旋转后前3个公因子累计方差75.13%。值得一提的是第4个主成分。虽然其初始特征根为0.833<1,但因子旋转后,其携带了近12%的原始信息量,且加入该公因子后4个公因子均具有较为显著的特征含义。因此,结合碎石图(图1)与累计方差贡献率综合考虑,对该公因子暂时予以保留。因子旋转后,各公因子间的方差贡献率差距缩小,大小顺序未发生改变。前4个主成分的累计方差贡献率87.19%>85%,与因子旋转前相同,可以代表所有指标的主要信息。

0cc4fc33eaaadbce253ae24798677f55.png

图1因子分析碎石图

7f4c2e229c79aa33cf54fc4be8fd4e78.png

表1解释的总方差

进行因子旋转后,因子载荷矩阵如表2所示。由表2可以看出公因子1在X2、X4、X6、X12和X13上有较大载荷,为中年女性因子;公因子2在X3、X5和X9上有较大载荷,为青年硕士因子;公因子3在X14、X15上有较大载荷,为正高级职称者、硕导因子;公因子4在X10、X16上有较大载荷,为博士、博导因子。因子旋转后,各公因子的意义更加明确,有利于进一步研究分析。

262cb24624322b45e1ff83a812e5496b.png

表2旋转成份矩阵

结合成分得分系数矩阵,可得各公因子表达式为:F1=0.117X2-0.024X3+0.356X4-0.2X5+0.165X6-0.151X9+0.269X10+0.346X12+0.304X13-0.152X14-0.053X15-0.202X16

F2=0.115X2+0.278X3-0.216X4+0.445X5+0.032X6+0.41X9-0.387X10-0.177X12-0.163X13+0.101X14+0.014X15+0.181X16

F3=0.002X2-0.084X3+0.029X4-0.01X5-0.055X6+0.108X9+0.03X10-0.144X12+0.033X13+0.471X14+0.573X15-0.143X16

F4=-0.087X2+0.067X3-0.037X4+0.057X5+0.024X6-0.132X9+0.472X10+0.046X12-0.079X13+0.031X14-0.235X15+0.709X16

使用逐步法对公因子F1-F4与科室科研绩效总分Y进行线性回归分析。F=12.343,P<0.001,模型具有统计学意义。方差膨胀因子VIF<5,方程不存在严重共线性。得到回归方程为:

Y= 453.712F1+201.790F2+240.545F4+919.960

进一步将公因子表达式代入上述公式,最终得到原始变量回归系数方程为:

Y=63.128X2+69.537X3+102.149X4+27.76X5+87.601X6+3.722X9+124.164X10+123.573X12+82.689X13-38.271X14-68.007X15+95.309X16+919.96

从上述方程可知,对科室科研绩效总分影响最大的四个因素为博士学位(β=124.164)、中级职称(β=123.573)、年龄≥40周岁(β=102.149)及博士生导师(β=95.309)。主成分回归方程的结果具体见表4。

055f2b1a07b1f9d72fac229324141a11.png

表3主成分回归方程结果(未提及该表格在正文中所展示的位置)

讨论 3.1 关于主成分回归分析中公因子提取数的选择

一般来说,因子分析中公因子的选择要满足特征值大于1的条件。但在一些情况下,如果过于关注某一项判断条件而忽略其它条件及专业意见的综合影响,因子分析可能会出现因子过量(Over-factoring)或因子不足(Under-factoring)的情况[]。在此情况下,可进一步将特征根与碎石图、方差贡献率及提取公因子的专业意义相结合,以避免关键因素的缺失或非关键因素的过量]。本研究中,在选取3个主成分的情况下,各公因子代表的特征含义不明确,且累计方差率不能包含原始主要信息(75.13%<85%)。在加入公因子4后,4个公因子均有明确的特征含义。结合碎石图,公因子4(特征根=0.833)与公因子3(特征根=1.051)非常接近。因子旋转后,其携带了12.06%的原始信息量,累计方差贡献率增至87.193%>85%。因此,综合考虑后对公因子4应该予以保留。

3.2 临床科室科研绩效与人员构成影响因素分析

本研究中,博士学位、中级职称、年龄≥40周岁及博士生导师是影响临床科室科研绩效的最重要的4个影响因素。

博士学位人员对临床科室科研绩效影响最高。有研究指出,科研能力是博士能力的核心,在发表科研论文、申请课题等显性科研成果上贡献显著[]。本研究中,SCI论文(405分)、国家级课题(181分)两项占比科研绩效总平均分63.7%,博士学位人员承担了更多的高级别课题、高影响因子SCI论文,进而贡献了更多的科研绩效。因此,临床科室应注重引进及培养博士人员,加强对博士人员科研精力的分配,合理减少规范化培训、科室轮转周期等,以促进科室达到更高的科研绩效水平。

中级职称人员是科研绩效贡献的潜力群体。发表论文是卫生专业技术人员职称晋级的必要条件,职称评定也是医务工作者发表SCI论文的最大内在驱动力[]。本研究中,中级职称对科室科研绩效影响显著,表明了中级职称人员较强的科研贡献意愿。同时也进一步验证了通过职称调节促进临床医生科研产出,从而带动科室科研绩效增加的因果性。

中年人员数量对科研绩效的影响比青年人员更高。有研究指出,高校46~55岁教师科研综合能力最强,对科研水平的提升至关重要[]。40周岁及以上人员科研贡献占主要比例,可能的原因是多数高级别的科研成果,如国家自然科学基金面上项目、高影响因子SCI论文、省部级科技奖励等需要较长时间的科研积累。年龄在本研究中的影响更倾向体现为科研基础和学术底蕴。所以从科研队伍可持续性来看,对青年科研人员的培养同样需要重点关注。

博士生导师人员因素很少被相关研究提及。博士生导师比例仅占样本总量的2.13%,对科研绩效的影响程度却排在12个指标中的第4位,说明博士生导师的团队资源、学术影响优势所带来的科研产出"规模效益"显著。博士生导师普遍拥有高级别课题、学科建设平台、重点实验室等,也拥有高素质的学生与团队资源,可以带来更多高质量的科研成果。

3.3 人员构成主成分分析对临床科室科研绩效的指导作用

通过主成分分析的结果,医院精准制定及调整相关科研激励政策。首先,为加强临床科室科研基础及科研成果产出的可持续性,医院针对性地制定"中青年学科精英、学科骨干及青年后备人才培养计划"等一系列鼓励政策。具体来说,医院对符合条件的45周岁以下中青年博士人员,按年龄及科教研的基础进行精英、骨干及后备人才3个等级的划分,分别予以不同程度的科研经费匹配额度,并设定相应科研指标,实现重点关注、全程管理,让博士人员有意愿、有条件、有动力地投入到科研工作中,促进医院科研绩效的第一步提升。其次,通过调整职称聘任标准,进一步强化科研绩效在职称晋级的激励作用。对中级职称实行分级管理,差额聘任,充分调动以中级人员为主体的医院员工投入科研的积极性。最后,医院通过"引进人才政策"引进科研业绩卓越的博士生导师,并为其建立科研团队,予以经费与科研环境的支持,使其成为科研薄弱学科的带头人,带动提升临床科室甚至医院整体的科研产出。

综上所述,构建一个以博士生导师带头、中级青年人员为基础、博士学位人员为骨干的人员队伍结构,将有利于科室科研绩效的提升。

ad8b4f8194f6e70cd92a123cde1de6dc.gif 1f04986d8590a99ef8851c3ea01ea8b6.png ad8b4f8194f6e70cd92a123cde1de6dc.gif

扫码关注“医学科研管理空间”公众号

好的,以下主成分分析碎石的绘制方法: 首先,我们需要导入必要的Python库,如numpy、pandas、matplotlib和sklearn等。然后,我们可以使用pandas库中的read_csv函数读取包含我们数据的csv文件: ```python import pandas as pd data = pd.read_csv('data.csv') ``` 接下来,我们需要对数据进行预处理。主成分分析需要标准化数据,因为不同的特征可能拥有不同的尺度范围。我们可以使用sklearn.preprocessing库中的StandardScaler函数来标准化数据: ```python from sklearn.preprocessing import StandardScaler # 标准化数据 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) ``` 接下来,我们可以使用sklearn.decomposition库中的PCA函数来进行主成分分析。我们可以指定要保留成分数量。如果我们不指定成分数量,则所有成分都会被保留。 ```python from sklearn.decomposition import PCA # 主成分分析 pca = PCA(n_components=2) principalComponents = pca.fit_transform(data_scaled) principalDf = pd.DataFrame(data = principalComponents, columns = ['PC1', 'PC2']) ``` 现在,我们已经得到了主成分分析的结果,我们可以将其可视化。我们可以使用matplotlib库中的scatter函数来绘制散点。 ```python import matplotlib.pyplot as plt # 绘制主成分分析散点 plt.scatter(principalDf['PC1'], principalDf['PC2']) plt.title('PCA Plot') plt.xlabel('PC1') plt.ylabel('PC2') plt.show() ``` 这样,我们就得到了主成分分析碎石。我们可以根据散点中的点的分布来判断数据中是否存在一些相关性或者聚类现象。 希望这个回答能够帮助到你,如果你还有其他问题,请随时问我。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值