《系统工程》文本分析技术最新进展总结盘点

[1]黄训江,闫康.基于Tf-LSTM的在线评论用户使用场景及关联产品特征需求研究[J/OL].系统工程,1-19[2024-04-23].http://kns.cnki.net/kcms/detail/43.1115.N.20240327.1624.004.html.    

关键词:场景识别;;情感分析;;Tf-LSTM;;产品特征    

摘要:“无场景,不产品”,场景体现了产品的使用价值,但却鲜少有涉及产品场景及相关属性配置的研究。在线评论中蕴含丰富的用户使用场景及与其相匹配产品特征的用户需求偏好信息,对这些信息的挖掘日益成为企业基于用户开展产品创新的关键。针对既有研究有效数据集中度低、模型识别精度差及未考虑产品使用场景等问题,设计了基于词的Tf-LSTM特定场景下的用户需求识别模型。通过词库构建、无效信息筛除、特征关注度计算、情感分类模型构建以及场景-特征与用户情感倾向的结合,为企业了解用户需求及改进产品提供了明确方向。太平洋汽车网用户生成内容的实验表明,本文情感分类模型的准确率、精确率和F1分别为92.8%、93.3%、93.0%,优于KNN、SVM、RNN、BERT等模型分类效果,场景-特征-情感的关联分析及特征改进优先级划分也为产品的创新改进指明了方向。


[2]王培培,周小平,陈昕玥.股票价格与情感的多特征嵌套注意力融合股价预测研究[J/OL].系统工程,1-14[2024-04-23].http://kns.cnki.net/kcms/detail/43.1115.N.20240119.1539.004.html.    

关键词:股价预测;;情感特征;;ARIMA;;BERT  

摘要: 针对提高股票价格预测的精确性问题,综合了股市行情与情感信息,最大程度降低干扰项对股民情感判断的负面影响,消除噪音和传言,以提高股票价格预测的准确性。首先,从股市和情感文本系列集选取特征、构建相关指标。其次,利用ARIMA模型生成预测残差数列,处理股票价格时间序列的长期趋势和季节性变化,捕捉序列的随机波动。通过DFAOA-BERT模型提取情感文本特征,构建情感分析模型,对评论进行情感评分或者分类,计算每条评论的投资者情绪指标以进行情感极性判别。最后,将股评的情感极性判别结果输入股市预测模型,形成多特征嵌套注意力融合股价预测模型,探讨投资者情绪与股票收益率和股票价格的关系。实验结果表明,该方法可有效提升预测精度。


[3]张宏,帅冰.基于自然语言处理的FIDIC银皮书责任追溯混合模型[J/OL].系统工程,1-12[2024-04-23].http://kns.cnki.net/kcms/detail/43.1115.n.20231118.1753.002.html.    

关键词:自然语言处理;;BERT;;文本分类;;混合建模;;合同管理    

摘要:建设项目实施阶段,各参与方常需要基于合同文本快速准确地追溯责任主体、规避项目纠纷。然而,冗长复杂的建设合同使得人工追责过程通常耗时易错。针对这一问题,本文基于2017版FIDIC银皮书设计了具有针对性的文本预处理机制以制作数据集,并且在深度学习框架下微调了BERT模型以提升责任句分类的准确率。在此基础上,本文进一步结合了基于规则的责任主体提取器和模糊检索算法,从而构建了检索灵活、应用稳健的FIDIC银皮书责任追溯混合模型。实证研究进一步证明了所提出模型对于国际EPC合同责任追溯的有效性。


[4]万平,李立状,娄峰,等.基于PSO-SVM的文本分类在保险精准营销中的应用[J].系统工程,2023,41(05):144-150.  

关键词:文本挖掘;;粒子群算法-支持向量机;;保险营销;;多分类    

摘要:为了研究大数据分析和挖掘技术对精准营销的支持能力,本文借助文本挖掘算法对消费者的选择偏好和行为习惯进行分类研究,并尝试借助粒子群算法(PSO)对支持向量机(SVM)的参数做最优化处理,最终利用参数最优化的支持向量机(SVM)对互联网保险论坛用户的消费行为进行精准营销预测,为建立有针对性的营销策略提供了科学的量化依据,也验证了PSO-SVM在文本分类上的良好效果。


[5]于素敏,何秋婷,林旭东,等.基于数据挖掘的共享住宿平台服务质量评价[J].系统工程,2023,41(02):135-147.    

关键词:共享住宿;;服务质量;;文本情感分析;;直觉模糊    

摘要:随着国内旅游行业持续发展,我国共享住宿行业保持着稳定的增长。同时,用户的需求趋向多元化,对平台服务质量的要求也日渐提高。明确用户真实需求、提高平台服务质量是共享住宿企业的战略重心。本文以服务质量模型和共享住宿的相关研究为基础,利用文本挖掘技术识别用户评论中的关键要素,搭建有形性、易用性、可靠性、响应性、经济性、移情性6个维度的评价体系;在此基础上,运用直觉模糊集量化评论文本,建立基于直觉模糊的TOPSIS评价模型;最后,评价国内5个具有代表性的共享住宿平台服务质量,并提出针对性的建议策略。本文为提升共享住宿平台的服务质量提供了科学依据,有助于平台企业从用户视角思考如何提升平台的服务质量。

[6]刘赛红,黄馨锋,余意.新型农业经营主体生产性消费金融风险识别——基于文本挖掘及问卷调查研究[J].系统工程,2022,40(01):121-132.    

关键词:新型农业经营主体;;文本先验信息;;生产性消费金融;;Probit;;TSVM    

摘要:本文首先从中国知网CSSCI数据库中挖掘期刊论文提取关于"新型农业经营主体、金融、风险"文本先验信息,并在此基础上设计问卷,调查、研究新型农业经营主体生产性消费金融风险。接着基于2020年全国新型农业经营主体的调查数据,运用二元选择模型识别其生产性消费金融风险的影响因素。研究结果显示:不同性别、资金来源的农户其风险具有显著性差异;较高学历水平、较高自有资产占比、完善农业信贷服务政策、购买自然灾害保险、购买病虫害损失保险有利于其按时还款;偿债压力提高、多种经营方式、市场价格波动、生产管理风险加大了违约概率。为了检验风险识别因素有效性,本文进一步使用TSVM模型对Probit模型识别的影响因素进行后验性检验。结果显示,上述11种影响因素可在很大程度上影响新型农业经营主体生产性消费金融风险形成,并由此提出一系列政策建议。


[7]朱文喜,曾滢,陈赟.建设工程招投标合谋研究热点演化及其态势分析[J].系统工程,2021,39(05):21-29.    

关键词:建设工程;;招投标;;合谋;;LDA主题模型;;主题演化    

摘要:招投标合谋是我国建筑市场的一大顽疾,挖掘建设工程招投标合谋研究领域的研究热点及其演化历程,可以为建设工程招投标领域的研究者、政策制定者提供相对丰富情报和决策依据,以协助其深入研究或科学治理建设工程招投标合谋现象。基于Python语言环境构建LDA模型,以建设工程招投标合谋研究领域的期刊及会议论文为研究对象,先识别该研究领域生命周期全局与不同阶段下的主题分布,后计算相邻阶段主题间的关联度,刻画该领域研究热点的演化历程。建设工程招投标合谋研究领域生命周期全局主题分布于合谋成因、合谋行为及腐败网络。合谋成因、合谋行为主题的研究贯穿于该研究领域生命周期的各个阶段,是稳定的研究热点;问题与对策、招投标风险主题的热度逐渐消散、融入其他主题;法律规制、评标机制、腐败网络成为近年来该领域的新兴研究热点。


[8]李宛哲,李英.考虑在线评论中个体标准差异的汽车产品排序方法[J].系统工程,2021,39(03):143-152.    

关键词:在线评论;;个体评价标准差异;;产品排序;;概率语言集;;语言尺度  

摘要:用户在线评论是影响消费者汽车产品选择决策的重要信息来源。已有的基于用户在线评论的产品排序研究中,较少考虑用户评价标准差异对排序结果的影响。基于文本型、数值型和极性评论数据,本文提出一种考虑个体评价标准差异的汽车产品排序方法:首先分析文本型评论中的用户情感,构建情感词典,得到初步情感得分;然后利用数值型和极性评论相关值为参数的可变语言尺度函数对情感得分进行调整,以平衡个体评价标准差异的影响;最后用概率语言集来表达调整后的情感得分及其概率密度,根据DS-PLWA算子进行融合得到最终评价结果。基于汽车之家论坛上6种汽车产品的用户在线评论数据,利用本文推荐排序方法进行实例分析,结果表明考虑个体评价标准差异会影响汽车产品排序结果。


[9]张杰,张永卿,翟东升.融合财经新闻信息的汇率波动预测[J].系统工程,2021,39(03):121-131.    

关键词:文本挖掘;;汇率波动预测;;深度学习;;新闻信息    

摘要:本文引入互联网财经新闻信息来对日汇率波动趋势进行更准确预测。使用深度学习文本分析模型提取新闻中与汇率波动趋势有关的信息,计算日新闻影响数值特征,并融合汇率历史数据建立时间卷积网络模型对汇率波动趋势进行预测,最后根据预测结果研究交易策略并进行模拟投资。研究新闻对汇率预测的影响作用可以为投资决策提供实证依据与理论支撑,为新闻与汇率波动建立了联系。实证表明,该方法能提高汇率波动趋势预测的准确率并能获得较高的投资收益,体现了新闻信息对汇率波动预测的重要影响作用。


[10]岳思诗,曹嘉威.机构投资者调研活动信息内容对股票收益率的预测——来自中国A股市场的数据[J].系统工程,2020,38(06):97-107.    

关键词:文本分析;;调研活动信息内容;;股票收益率;;预测力    

摘要:本研究通过分析机构调研信息文本中的关键词,构建了调研活动信息内容的测度框架,并研究了基于调研日的调研内容月度时序对中国股票收益率的预测能力。研究发现,机构投资者调研活动信息内容在样本内和样本外均能显著预测下月中国股票市场的超额收益率,且相较于经济变量具有更好的预测力。机构投资者调研时所获取的信息内容可作为预测股票收益率的信号并通过影响投资者情绪,从而对股票市场的收益率产生影响。通过文献比较表明,基于机构调研日的调研信息时序相较于基于调研报告披露日的调研信息时序在股票收益预测中更具价值。


[11]孙冰,毛鸿影,尹程顺.基于社会支持视角的虚拟技术社区用户角色识别与演变[J].系统工程,2020,38(06):25-34.    

关键词:虚拟技术社区;;用户角色;;角色演变;;社会支持;;文本挖掘    

摘要:随着网络社区的出现,越来越多的人参与到网络技术社区中来,以满足个性化的学习需求。已有学者建立了虚拟社区用户角色模型,然而,用户角色的动态演化还未得到解决。本文使用来自百度贴吧的Python技术社区的文本数据,通过有监督机器学习的文本分类算法确定了每条帖子的社会支持类型,利用聚类分析法将具有不同社会支持特征的用户进行分类,并确定虚拟社区中用户的角色,最后采用角色演化网络图展示用户角色的演变轨迹。研究结果表明,虚拟技术社区包括7种用户角色:信息寻求者、信息提供者、情感寻求者、情感提供者、友谊尊崇者、信息爱好者和非社会支持参与者。同时发现,用户角色会随时间的推移而变化,用户在社区注册后大概率会成为非社会支持参与者,最有可能离开社区的是情感寻求者,最稳定的用户群是信息爱好者和友谊尊崇者。研究结果将有助于虚拟技术社区运营商为不同角色的用户提供有针对性的服务,从而有助于维护技术社区的可持续发展。

  • 15
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值