优秀博士学位论文代表了各学科领域博士研究生研究成果的最高水平,本公众号近期将推出“优秀博士学位论文分享”系列文章,对人工智能领域2023年优秀博士学位论文进行介绍和分享,方便广大读者了解人工智能领域最前沿的研究进展。
“博士学位论文激励计划”(原优秀博士学位论文奖)是对博士研究生学位论文的一项重大奖励,由各大学会通过严格评选后颁布。中国计算机学会、中国自动化学会、中国人工智能学会等各大学会每年都会颁布该奖项。该奖项的目的是促进学术研究的卓越性,并鼓励产出高质量的博士论文。博士研究生如果能够荣获该奖项,则表明其学术研究生涯早期的成果受到了很高的认可。
本文主要介绍CCF优秀博士学位论文《面向人才评估的可解释神经网络算法研究》,其聚焦于人才评估中的关键问题——如何在确保模型准确性的同时,提供对模型判断依据的直观理解。这一研究工作提出了一套全新的神经网络算法,涵盖人才选择、吸引、管理、培养及使用等环节,有效提升了模型的可解释性。该论文的数据和代码已公开,供读者学习和应用,以推动相关领域的研究进步。本文的作者为陆新颖,审校为朱旺和许东舟。
一、论文介绍
1.1 背景与挑战
在当前人才强国战略的背景下,高效的人才管理至关重要。人才作为具有专业知识和技能、能够进行创造性劳动并对社会做出贡献的重要资源,在科技和社会分工的推动下呈现多样化趋势,因此需要进行细粒度的评估。然而,传统的评估方法面临诸如数据稀疏、环境因素影响、人才多样性和动态性等挑战。在这种背景下,互联网招聘和信息化人力资源管理积累了大量人才数据,为评估提供了条件。
为了解决这些挑战,研究人员提出了面向人才评估的可解释神经网络算法,这一创新在以下几个方面有所突破:
(1)神经网络的成功应用:神经网络在其他领域取得了成功,具有处理复杂输入和任务的能力,为解决人才评估中的复杂性提供了新的可能性。
(2)模型可解释性的提升:针对现有方法难以满足人才管理中对技能、人才、组织和市场复杂关系解释需求的问题,研究人员着重提升了神经网络模型的可解释性。
(3)合理的神经网络结构设计:通过更合理地设计神经网络结构,文从人才管理的选、留、育、用四个关键环节出发,使模型能够明确符号化重要特征和决策依据,提供更丰富的决策支持信息。
通过以上创新,新算法为人才管理者提供了更可靠的评估工具,为人才选拔、培养和流动等决策提供了更清晰、更可行的指导,推动了人才、组织和国家的可持续发展。
1.2 方法
本文以人才管理的选、留、育、用四个关键环节为基础,提出了基于神经网络的全流程人才评估解决方案。核心思想在于对关键判断依据进行明确的符号化建模,以支持模型的理解和可解释性。为此,从输入贡献、概念变换、决策目标、关系影响四个层面展开可解释的神经网络算法研究,满足不同任务对模型解释性的要求。
具体而言,针对任务层面的选、留、育、用四个环节,依次提出了技能价值评估、薪酬评估、技能学习评估和组织匹配性评估等解决方案。这些方案在模型的输入-转换-输出三个阶段中,分别关注全局/局部贡献、概念变换过程、决策目标效用和组织关系建模,以达到可解释的目的。
在算法层面,根据不同环节的需求,提出了可解释神经网络算法的多样化方案。具体而言,针对输入贡献、概念变换、决策目标效用和关系影响四个层面,分别开展了相应的可解释神经网络算法研究。这些算法能够根据任务关注的方面,提供输入特征、概念变换、决策逻辑和关键关系等方面的可解释性支持,基本研究框架如图1所示。
图1 基本研究框架
这篇论文针对人才管理的选、留、育、用四个环节,提出了一套基于可解释神经网络的全流程人才评估解决方案。具体而言,作者提出了五种可解释神经网络模型,分别应用于不同的人才评估任务:
(1) 可解释支配式特征价值网络及技能价值评估:该模型主要用于评估人才的技能价值,通过解释每个特征在决策中的支配作用来确定技能的重要性,如图2所示。该模型所得元素价值可从输入层面提供特征对输出贡献的全局解释。
图2 可解释支配式特征价值网络及技能价值评估
(2) 可解释增量式特征贡献网络及工作薪酬评估:该模型用于评估工作薪酬,通过解释特征的增量贡献来确定个体在工作中的价值,如图3所示。特别的是,区别于以往基于归纳偏置保证排列不变性的做法,该模型利用集合的顺序不变性实现数据增强,有效地提升模型的泛化性和鲁棒性。
图3 可解释增量式特征贡献网络及工作薪酬评估
(3) 可解释投票机制概念推断网络:该模型用于推断概念之间的关系,通过解释网络中的投票机制来推断人才之间的概念关联,如图4所示。其改变将中间信息嵌入大规模隐藏单元的做法,明确对少量隐藏概念进行符号化建模,通过单变量非线性函数进行概念变换,可在不牺牲表达能力的前提下降低特征耦合,以直观可理解的转换过程得到更高准确性。
图4 可解释投票机制概念推断网络
(4)可解释多目标双重Q网络及技能学习评估:该模型用于评估人才的学习能力,通过解释双重 Q 网络中的多目标来评估人才的技能学习情况,如图5所示,通过对不同目标上的长短期效用及其关联进行建模,可解释所推荐行动的目标层依据。
图5 可解释多目标双重Q网络及技能学习评估
(5)可解释树结构关系注意力网络及组织匹配性评估:该模型用于评估人才与组织的匹配程度,通过解释树结构关系注意力网络中的注意力机制来评估人才与组织之间的匹配性,如图6所示。特别地,为提高环境特征提取效率,提出基于稀疏矩阵运算的高效算法,以线性时间复杂度实现关系识别及聚合。
图6 可解释树结构关系注意力网络及组织匹配性评估
这些模型在背景介绍、算法思想和详细的算法实现上都进行了详细的阐述,并通过丰富的实验验证了其有效性和可解释性。
1.3 实验结果
该研究从拉勾网上收集了超过 800,000 条信息技术相关岗位的人才招聘广告,经过文本处理后提取了14个等级词和1,374个技能词,并将岗位结构化为包含技能集、场景和薪酬信息的样本。为减少噪音,筛选了招聘广告发布数量最高的16个城市和最高的1,000家公司的样本,并删除了异常值。经过预处理,实验数据集包含 215,308 条结构化样本。并结合基于技能集的薪酬预测公开数据、集情境感知多模式交通推荐数据集,搜索转换率预测数据集、森林覆盖类型预测数据集、人口普查收入预测数据集、Allstate索赔预测数据集和希格斯玻色子数据集,与其他方法进行对比试验,进行了10次留出验证。基于现实场景薪酬数据集,本章对所提模型进行了大量定量及定性实验。实验结果表明,模型可以在各种工作场景下都有着更强的表现和更优的可解释性。
1.4 结论
尽管近些年学界出现了一些针对神经网络事后解释算法的研究,但其只能提供启发式理解,无法揭示神经网络真实的判断过程。为满足人才评估等现实专家决策场景中对解释性的更高要求,论文面向选、留、育、用四个环节人才评估任务,从输入贡献、概念变换、决策目标、关系影响四个层面开展可解释的神经网络算法研究,在保证模型准确性的同时满足不同任务的多样化解释要求,从而给出全流程的人才评估解决方案。
二、作者介绍
孙莹,作为中国科学院计算技术研究所的工学博士毕业生,和她的导师何清研究员共同致力于可解释神经网络算法的研究。在她的博士学业生涯中,孙莹不仅发表了多篇学术论文,还获得了若干专利,赢得了业界和学术界的认可。她的研究成果展现了出色的学术深度和应用广度,成为她获得CCF优秀博士学位论文奖项的坚实基础。
成果类型 | 成果 | 评级 |
学术论文
| Market-oriented Job Skill Valuation with Cooperative Composition Neural Network. | Nature Communications |
Discerning Decision-Making Process of Deep Neural Networks with Hierarchical Voting Transformation. | CCF A 类 | |
Modeling the Impact of Person-Organization Fit on Talent Management with Structure-Aware Attentive Neural Networks. | CCF A 类 | |
Cost-Effective and Interpretable Job Skill Recommendation with Deep Reinforcement Learning. | CCF A 类 | |
The Impact of Person-Organization Fit on Talent Management: A Structure-Aware Convolutional Neural Network Approach. | CCF A 类 | |
Exploring the Urban Region-of-Interest through the Analysis of Online Map Search Queries. | CCF A 类 | |
Adaptively Sharing Multi-Levels of Distributed Representations in Multi-Task Learning. | CCF B 类 | |
Exploring the Tidal Effect of Urban Business District with Large-scale Human Mobility Data. | CCF C 类, | |
Talent Demand Forecasting with Attentive Neural Sequential Model. | CCF A 类 | |
Exploring the Risky Travel Area and Behavior of Car-hailing Service. | CCF C 类 | |
Learning to Warm Up Cold Item Embeddings for Cold-start Recommendation with Meta Scaling and Shifting Networks. | CCF A 类 | |
Rapid Learning of Earthquake Felt Area and Intensity Distribution with Real-time Search Engine Queries. | Nature 旗下期刊 | |
Meta-path Hierarchical Heterogeneous Graph Convolution Network for High Potential Scholar Recognition. | CCF B 类 | |
Potential Off-Grid User Prediction System Based on Spark. | ZTE Communications | |
专利 | 基于分布式并行决策树的高维特征数据分类方 法及系统 | 授权专利 |
科研项目 | 基于超算的大数据分析处理基础算法与编程支撑环境 | 国家自然能科学基金重大项目 |
基于开放知识网络的特定目标隐 含线索发现研究 | 国家自然科学基金重点项目 | |
大数据分析的基础理论和技术方法 | 国家重点研发计划项目 | |
基于深度学习的推荐算法 | 国家自然科学基金面上项目 | |
面向异构环境的多任务多视图学习算法研究 | 国家自然科学基金面上项目 | |
“证券管理决策大数据挖掘云服务平台研 究” | 国家自然科学基金面上项目 | |
电信大数据分析及应用示范 | 广东省省级科技计划项目 | |
获奖情况 | 2021 年度博士生国家奖学金 | 国家奖学金 |
2019 年度硕士生国家奖学金 | 国家奖学金 | |
2018 年度北纬优秀科研硕士生奖 | ||
中国科学院大学“三好学生”荣誉称号 | ||
中科院计算所 2019 年度“优秀志愿者” | ||
一等学业奖学金 (2018, 2019, 2021) | ||
The Web Conference Student Scholarship Award (2021) | ||
KDD Student Travel Award (2018, 2019) |
三、指导老师——何清教授简介
何清教授是中国科学院计算技术研究所研究员、博士生导师,以在机器学习与数据挖掘领域的卓越贡献而闻名。他提出了多项重要算法,如基于超曲面的覆盖学习算法、极小样本集抽样方法、基于进化规划的摄动模糊聚类改进算法等,解决了相关领域的重要问题。何清在国内外重要期刊和会议上发表了大量学术论文,被引用数众多。他领导团队开发了基于云计算的并行数据挖掘平台,在大数据挖掘方面取得突出成就,推动了我国自主知识产权的发展。此外还承担多项国家自然科学基金和863项目,并取得优异评价。
四、实验室介绍——中国科学院智能信息处理重点实验室
中国科学院智能信息处理重点实验室成立于1987年,依托于中国科学院计算技术研究所。在学术委员会和计算技术研究所的支持下,实验室成为中国智能信息处理领域的重要基础研究基地。其研究工作旨在服务国家需求和国际科技前沿,探索机器感知与认知的机理、方法和技术,解决核心技术问题,培育基础人才,促进智能技术向智能产业的发展。实验室主要研究方向涵盖计算机视觉、模式识别、机器学习与数据挖掘、自然语言处理与理解、医疗影像分析、生物信息学、智能人机接口等领域。过去十年来,实验室在国际顶尖期刊和会议上发表了大量高水平论文,取得了丰硕的研究成果,获得了多项国家级奖项和发明专利授权。在产业应用方面,实验室的技术已成功应用于人脸识别、机器翻译、知识处理等领域,产生了良好的经济和社会效益。