《系统管理学报》文本分析技术最新进展总结盘点

[1]杨彤,党延忠,徐照光,等.基于扎根理论的感知质量属性抽取方法研究[J/OL].系统管理学报,1-17[2024-04-29].http://kns.cnki.net/kcms/detail/31.1977.N.20240322.1307.002.html.    

关键词:扎根理论;;在线论坛;;属性抽取;;文本挖掘;;归纳法  

摘要: 感知质量是消费者对产品属性的感性认识,对制造企业十分重要。考虑到消费者感知到的产品属性不同于企业生产中的属性体系,面向在线论坛数据,构建了基于扎根理论的感知质量属性抽取方法。该方法由两阶段构成,首先,在编码过程中通过归纳法流程提取规则,以更好地适应大数据情境;其次,在理论饱和度检验中基于文本挖掘方法提出一个三阶段的检验流程,以降低人工工作量。在大量汽车论坛数据的实例分析中,得到了8个消费者感知到的汽车属性。该方法保证了属性抽取的完备性,并降低了人工工作量。该研究对感知质量和属性抽取研究具有理论意义,也提高了制造企业的消费者大数据处理能力。


[2]胡文轩,司广森,张凡,等.哪种语言是患者期望的?在线健康平台上医生交互语言对患者的影响[J/OL].系统管理学报,1-18[2024-04-29].http://kns.cnki.net/kcms/detail/31.1977.N.20240314.1942.002.html.    

关键词:在线健康平台;;医患交互;;医生语言;;患者期望;;机器学习    

摘要:医生在健康平台上使用文字语言为患者提供疾病指导信息,而医生语言信息不太可能被患有不同疾病的患者全部接受。基于语言期望理论,识别在线医患交互背景下医生医疗专业性和人际性语言,并探究其对患者满意感知和回报行为的影响以及患者疾病严重程度的调节作用。以国内一家领先的健康平台为研究对象,采集约52000条在线医患交互数据,采用文本挖掘、机器学习等方法处理数据。实证结果显示:医生医疗专业性语言正向影响患者满意感知和回报行为,而人际性语言负向影响患者满意感知和回报行为。患者疾病严重程度正向调节医生医疗专业性语言的影响,而负向调节医生人际性语言的影响。研究结果为医生如何在交互中有效使用文字语言满足具有不同疾病严重程度的患者期望提供指导。


[3]赵爽,马君.算法管理与员工创造力:借算法之势而创还是困数字牢笼而息[J/OL].系统管理学报,1-26[2024-04-29].http://kns.cnki.net/kcms/detail/31.1977.N.20240119.1536.004.html.    

关键词:算法管理;;员工创造力;;工作重塑;;自我决定理论;;文本分析;;倒U效应    

摘要:算法管理替代传统经验管理已成为不可逆转的趋势。集成“最佳实践”智慧的算法管理是帮助员工站在“巨人肩上”拥有了更多的时间和空间产生创造力还是导致员工产生认知依赖或束缚于“数字牢笼”而乏善可陈尚未得知。基于自我决定理论,构建了算法管理影响员工创造力的非线性框架。研究1(预研究)通过Python对社交媒体数据进行文本分析,获取社会大众对算法管理的情感倾向,并在此基础上提炼增益效应和损耗效应两条不同的情感倾向,为探索算法管理对创造力的非线性效应奠定基础。研究2进一步探索了非线性成因以及员工“自下而上”的工作重塑在这一过程中所发挥的作用。结果发现:算法管理对创造力存在倒U型影响,内在动机起部分中介作用,工作重塑则可以缓解两者的倒U型关系。研究阐明了算法管理的“过犹不及”效应以及工作重塑促使算法管理“扬长补短”的内在机制,对企业优化算法管理推动创新发展具有重要意义。


[4]路薇,高盼,翟运开.带有反馈调节的远程医疗专家自适化推荐[J].系统管理学报,2023,32(05):960-975.    

关键词:专家推荐;;反馈调节;;兴趣度;;活跃度;;长短期知识  

摘要: 医生推荐能够从专业层面帮助患者快速准确地找到符合需求的医生,确保医疗服务价值的有效实现。从隐私保护出发,提出了一种带有反馈调节的远程医疗专家自适化推荐方法,更强调推荐结果的适应性及可接受性。通过对患者病历和专家长、短期知识特征建模,挖掘知识特征间的相似性,据此缓解专家推荐中的冷启动问题并生成专家推荐指数;将专家活跃度、兴趣度及反馈机制纳入推荐框架,在考虑专家个体行为变化与患者偏好的同时实现专家推荐的动态闭环调整优化,使推荐结果更具解释性和自适性,提升推荐能力;多组对比分析实验验证了融合推荐策略的有效性,实现了患者需求和服务能力的有效适配。研究成果不仅能为远程医疗实践提供借鉴,也为后续相关研究提供理论参考。


[5]沈隆,周颖.管理层讨论与分析能预示企业违约吗?——基于中国股市的实证分析[J].系统管理学报,2024,33(02):441-459.    

关键词:文本挖掘;;管理层讨论与分析;;违约预测;;代价敏感GBDT;;信息不对称    

摘要:采用文本挖掘技术,对上市公司年报中的管理层讨论与分析(MD&A)内容进行文本分析,从文本相似度、文本可读性、文本语调以及管理层预期的角度构建了MD&A评价体系。通过构建代价敏感GBDT(csGBDT)模型,考察多维管理层讨论与分析指标对企业违约预测的影响,并进一步分析了对企业违约状态有重要影响的MD&A指标及其对违约状态作用的边际效应。研究表明:MD&A指标可以作为替代性数据源准确预测上市公司违约状态;MD&A指标相比传统违约预测变量的预测效果较差;MD&A指标在传统违约判别指标基础上提供了额外的信息含量;csGBDT模型显著提高了对企业(尤其是对违约企业)的判别能力,在违约预测的大数据方法中具有明显优势。在众多管理层讨论与分析指标中,对企业违约有重要影响的MD&A指标依次为:与前一年相比文本相似度、词汇总量、情感语调2、词汇总量/句子数量、情感语调1和管理层是否发出业绩预测。本文将企业违约预测的研究边界从结构化数据拓展到非结构化文本数据,有助于抑制信息不对称导致的企业违约风险。


[6]孙灏,朱晓谦,李建平.考虑财务报告中文本风险信息的财务困境预测[J].系统管理学报,2022,31(06):1204-1215.    

关键词:财务困境;;财务报告;;文本风险信息;;文本挖掘;;机器学习    

摘要:现有的财务困境预测研究大多忽略了公司在年度财务报告中以文本形式披露的风险信息,而相比于公司披露的其他类型的文本,这些风险信息能够更加直接和前瞻地反映公司经营中的潜在重要风险。创新性地引入财务报告中的文本风险信息进行财务困境预测,并构建了能够反映所披露的风险对公司产生影响的可能性的文本特征指标——风险可能性,而后采用机器学习方法构建预测模型。基于2006~2020年美国35 706个上市公司年度样本的实证研究发现:在常用的财务及市场各类定量指标的基础上,融合财务报告中的文本风险信息能够显著提升公司财务困境的预测效果;相比于其他常用文本特征指标,本研究提出的风险可能性指标在财务困境预测中表现的重要度最高;定量指标的财务困境预测能力随着预测时间窗口的提前而明显下降,而文本风险信息的预测能力不仅没有下降,还呈现出了更为显著的提升效果。本研究可以帮助市场投资者、监管机构理解如何解读公司在财务报告中披露的文本风险信息,并为实现财务困境预测中融合文本信息提供了理论指导。


[7]杨虑,鲁耀斌,胡鹏.何种APP更受用户欢迎?基于第三方平台的用户下载数据分析[J].系统管理学报,2023,32(01):91-100.    

关键词:移动APP;;受欢迎程度;;被删除评论;;计量模型分析;;文本挖掘    

摘要:当今移动互联网时代,各种类型的APP不断涌现,使得APP的市场竞争日益激烈,只有受用户欢迎的APP才能获得流量而存活下来,厘清哪些因素会影响APP的受欢迎程度对于APP开发者提升产品的用户规模以及用户留存具有重要价值。以往研究大多基于用户单侧视角而忽略了用户删除评论这个行为,本研究将用户视角与开发者视角相结合,考虑了被删除评论及其背后的机制,系统性地探究了APP受欢迎程度的影响因素。基于苹果应用商城中2 528个APP数据的计量模型分析结果发现,被删除评论与APP下载量之间存在倒“U”型关系,是否有支付项对APP下载量产生负面影响,而评论数量、用户评分、上线时长以及安装包大小均对APP下载量有积极影响。基于对“被删除评论”等因素的探究,为APP开发者和营销人员提出注重用户的长期体验、结合营销策略以丰富APP功能等APP市场拓展策略和建议。


[8]吴红,申婧璇,邓朝华,等.问题特征与用户特征对在线用户新冠肺炎疫情知识共享行为的动态影响:问题信息量与问题聚焦度[J].系统管理学报,2023,32(02):319-331.  

关键词: 知识共享;;社交媒体;;问题信息量;;问题聚焦度;;用户特征    

摘要:社交媒体作为信息传递、观点交流和帮助寻求的重要媒介,在新冠肺炎病毒爆发期间发挥着尤为重要的作用。如何促进用户知识共享是社交媒体研究热点。以新冠肺炎疫情为研究背景,从谁在发帖和如何发帖两个维度探究在线知识共享行为。首先,基于LDA算法对相关帖子进行主题聚类,获得帖子的问题特征;纳入问题特征与用户特征,重点关注帖子问题信息量与聚焦度,构建用户知识共享行为的影响因素模型;考虑事件发展的3个阶段,探究影响因素在不同阶段影响的差异性。研究结果表明:通过提高问题聚焦度与信息量可以有效促进用户的在线知识共享行为。在事件发展的不同阶段(初期、爆发期、缓和期),问题特征和用户特征的影响具有异质性。社会认同对身份标识/社会连接与知识共享行为关系的调节作用显著。为知识共享行为的相关研究提供了新的研究视角,研究结果对用户行为和平台规则制定具有一定的指导作用。


[9]赵雪峰,吴德林,吴伟伟,等.基于多头注意力机制的BM-Linear信用贷款评估模型[J].系统管理学报,2023,32(01):118-129.    

关键词:多头注意力机制;;Bert;;Bag-of-Words;;信用贷款;;深度学习    

摘要:信贷评估模型可加快放贷效率、缩减放贷时间。利用Pytorch深度学习框架,组合Bag-of-Words及Bert中多头注意力机制得到BM-Linear评估模型,同时在引入多组信贷训练集的前提下,创造性地构建参数独立训练及参数共用训练的对比实验,探究BM-Linear的优异性。研究表明:BM-Linear首先弱化与信贷训练集的对应关系,解决信贷模型受限于信贷场景问题,减少因反复训练模型所造成的放贷效率低下现象;其次,忽略缺失特征并将离散特征转为信贷文本,降低特征处理造成的信贷干扰,提高信贷评估效率;最后,克服因词袋与信贷词语对应关系所带来的词向量固化问题,实现动态词向量过程,进而提高评估准确率。所提出的BM-Linear模型,可为信贷机构高效评估快速放贷提供支持。


[10]王盼盼,吴志艳,罗继锋.有偿奖励对医生在线健康社区中贡献行为的影响[J].系统管理学报,2022,31(02):343-352.    

关键词:在线健康社区;;金钱激励;;自愿贡献;;自然实验;;双重差分    

摘要:如何激励用户自愿贡献知识是保持在线社区活跃度的关键。近年来,学者开始探讨有偿激励对在线社区自愿贡献的影响。然而,较少有研究分析多边平台下的有偿激励的溢出效应。借助于自然实验的设计,考虑一种服务主导型在线社区——在线健康社区中,服务提供者(即医生)开通有偿服务(电话咨询)渠道对其知识贡献行为的影响。研究发现:开通有偿服务后,医生会在原来的免费文本咨询服务上也花费更多努力,提供更多、更及时和详实的医疗建议。同时,有偿服务对医生知识贡献的激励作用因医生社交互动程度而不同。相对于社交互动多的医生,社交互动少的医生开通电话咨询后,文本咨询努力程度的增加更明显。以往有关有偿激励对在线社区自愿贡献的影响多基于单边平台中产品主导型激励,该研究将有偿激励拓展至服务主导型的双边平台场景中。采用自然实验的设计,探索有偿激励对自愿贡献的因果关系及异质性,为平台设计和治理提供参考。


[11]杨墨,董大勇,徐永安.风险信息披露与股票流动性——基于中国A股上市公司年报文本分析[J].系统管理学报,2022,31(04):794-810.    

关键词:风险信息披露;;市场流动性;;投资者情绪  

摘要: 以2012~2018年中国A股上市公司作为研究样本,采用文本分析技术,利用正则表达式检索和提取公司年报风险段落,并以风险关联词度量年报风险披露的程度,实证检验了风险信息披露与股票流动性水平的关系。研究结果表明:风险信息披露与股票流动性负相关,说明披露的风险越多,市场风险感知越强,投资者交易行为更加谨慎,股票流动性越低;在风险披露影响股票流动性的过程中,投资者情绪起到了不完全中介作用;相比于国有、信息质量较高以及地区法律环境较好的企业,在非国有、信息质量较低以及地区法律环境较差的企业中,风险披露与流动性的负相关关系更加显著;风险披露语调和非模板化程度同更高的流动性相关;不同于风险披露与长期流动性的负相关关系,风险披露与短期异常流动性正相关。系统性地检验了中国风险信息披露对市场流动性的影响,丰富了风险信息披露与市场流动性相关的文献。在实证基础上,指出中国风险信息披露现有不足,建议加强上市公司风险披露监管力度,提高信息披露质量,完善市场制度规范的政策,以更好地保护投资者基本利益,提高市场资源配置效率。


[12]卞世博,贾德奎,阎志鹏.招股说明书负面语调与IPO表现[J].系统管理学报,2020,29(06):1025-1033.    

关键词:招股说明书;;中文财经情感词典;;负面语调;;IPO首日回报率;;长期表现    

摘要:通过构建中文财经情感词典,利用文本分析方法对招股说明书负面语调进行量化,并在此基础上实证分析招股说明书负面语调与IPO首日回报及IPO长期表现之间的可能关联。结果发现:招股说明书负面语调与IPO首日回报率之间呈显著的正相关关系;而在IPO长期表现方面,招股说明书的负面语调越强,则公司上市后投资者长期持有股票获得超额回报率的可能性越小。研究结论表明:招股说明书的负面语调有较高的有效信息含量,其量化结果对IPO首日回报及IPO长期表现有一定的解释能力。


[13]赵雪峰,吴伟伟,时辉凝.基于自然语言处理与深度学习的信用贷款评估模型[J].系统管理学报,2020,29(04):629-638.    

关键词:自然语言处理;;卷积神经网络;;深度学习;;信用贷款    

摘要:针对信用贷款评估模型存在特征预处理复杂、受主观因素干扰、准确率较低等现象,提出一种新模型。该模型首先组建连续性信贷特征文本数据,然后使用Word2Vec算法进行词向量化后通过词嵌入层衔接卷积神经网络(CNN)进行评估,通过Keras框架并依据2008~2018年的银行个人信贷数据进行实证分析。结果表明:新模型的总体评估准确率高达91.7%,无需对缺失特征进行处理并可直接评估,且评估准确率更优异,达到85.8%。新模型将离散型的信贷特征转变为连续性文本,降低特征预处理复杂度,结合Word2Vec与自然语言处理实现直接评估缺失信贷特征的目的,并基于CNN优异的特征分析能力最终提高信贷评估模型鲁棒性,进一步改善信用贷款评估模型中存在的部分问题,同时避免评估中主观因素的干扰。

  • 34
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值