《运筹与管理》文本分析技术最新进展总结盘点

[1]郭小宇,马静.基于深度学习的电商商品购买意图识别模型[J].运筹与管理,2024,33(01):145-150.  

关键词:购买意图识别;;卷积神经网络;;深层语义模型;;深度学习    

摘要:识别用户的购买意图是提升电子商务购买率(PR)的重要方法之一。针对用户购买意图不明确的现象,提出一种新模型。该模型将训练后的Word2Vec(WV)词向量馈入卷积神经网络(CNN),通过深层语义模型(DSSM)进一步提取文本特征。在Keras框架下结合美国建材电商网站家得宝的真实搜索数据进行实证分析。结果表明,在五分类问题中,新模型在测试数据集上的F1-score达80.6%。新模型使用了Word2Vec与CNN提取文本特征,并应用DSSM模型进一步提取了用户检索与商品描述文档在高维空间中的特征表示,最大化利用了用户检索与正确商品描述之间的语义相似度,同时避免了特征提取时主观因素的干扰,提高了商品购买意图的识别效果。


[2]徐鲲,李莹,鲍新中.考虑文本情感特征的电商小微企业信用风险预警[J].运筹与管理,2023,32(12):195-201.    

关键词:文本情感特征;;信用风险预警;;随机森林;;网格搜索    

摘要:电商小微企业为社会创造多元就业岗位、促进先进生产力发展,但信用风险影响其正常融资与发展。为进一步完善电商小微企业信用风险预警问题,基于淘宝生鲜行业小微企业的真实交易数据,考虑在线评论的文本情感特征,建立主客观两维度的信用风险指标体系;构建“两步法”网格搜索算法优化的随机森林模型,并运用SMOTE获取平衡数据集以构建更严格的预警模型;同时通过建立Logistic、CART、随机森林三大模型来设置对照组。实证结果表明:(1)考虑文本情感特征因素后所构建主客观两维度指标体系有效合理,通过了ROC有效性判定。(2)“两步法”网格搜索算法优化的随机森林模型效果优于其他三种预警模型。(3)平衡数据集不管对于单个预警模型还是集成预警模型而言都至关重要。研究为电商平台、金融机构建立统一预警模型、科学预测电商小微企业信用、高效贷款提供新思路。


[3]石荣丽,林艺舒.基于特征优选和SVM的船舶航行事故致因分析[J].运筹与管理,2023,32(12):99-105.    

关键词:交通安全;;航行事故;;致因因素;;SVM-RFE;;优化算法  

摘要:在“海运强国”战略和建设“海上丝绸之路”的大背景下,我国对船舶航行安全提出更高的要求。本文基于特征优选和支持向量机模型,挖掘出船舶航行事故的致因并分析各个因素对事故的影响程度。首先,通过文本挖掘和相关性分析对输入特征进行优选,筛选出航行事故责任船舶与其他船舶存在明显差异的因素作为航行事故致因。然后,构建基于SVM的船舶航行事故识别模型,并通过交叉验证及群体智能优化算法选择模型的最佳参数组合,得到最优的分类模型。最后,利用递归特征消除算法将上述致因对事故的影响程度进行排序和筛选,挖掘出事故的关键致因。通过广东省的水上交通事故实例验证模型的有效性,结果表明:本模型(正确度为90.1%)较传统单一的SVM模型(正确度为75.0%)具有更高的精度。研究结果可为减少船舶航行事故提供有效的科学建议。


[4]张丽,张祯.基于文本挖掘的新冠肺炎疫情下医药在线消费者的需求研究[J/OL].运筹与管理,1-8[2024-04-23].http://kns.cnki.net/kcms/detail/34.1133.G3.20230901.0849.002.html.    

关键词:在线评论;;文本挖掘;;情感分析;;LDA主题模型;;COVID-19    

摘要:基于新冠肺炎疫情下医药电商交易规模的爆炸式增长,对医药电商在线评论进行文本分析,以某B2C医药电商平台2019?2021年在线评论数据为样本,利用LDA主题模型提取在线评论蕴含的主题,并构建情感词典融合深度学习的情感分析模型,对评论和主题词进行情感分析。研究结果显示:1)消费者网购医药商品始终关注平台的可靠性、物流服务、商品价格、药品的使用效果;2)新冠肺炎疫情爆发之前,消费者对服务态度、商品品牌、购买便捷性有很大关注度;疫情爆发后对感冒类和维生素类药品关注度更高,疫情的爆发会影响消费者的购药决策;后疫情时代,消费者更关注商品性价比、购买快捷性以及药品的品质;3)消费者对于在医药电商平台进行购药整体上表现出积极正面的情感态度;4)负面在线评论主要集中在价格、药效、处方药购买、虚假宣传、物流包装、限购等方面。本研究挖掘出疫情下消费者对于网购医药商品的需求重点和痛点,对医药电商平台改善服务质量提供建设性意见。


[5]胡东滨,周普.数字化转型对环境服务企业绩效的影响研究——基于年度报告文本的实证分析[J/OL].运筹与管理,1-8[2024-04-23].http://kns.cnki.net/kcms/detail/34.1133.G3.20230214.1021.004.html.    

关键词:数字化转型;;企业绩效;;文本分析;;环境服务企业  

摘要: “双碳”背景下,环境服务业作为保障我国绿色发展的重要力量,势必将在实现“3060”目标的过程中起到关键作用。近年来,数字环保、智慧环保等新理念的兴起,为环境服务企业的转型发展提供了新思路。本研究选取2010—2019年我国237家环境服务上市企业数据,采用文本分析法构建关键指标,从直接传导机制、间接传导机制和异质性传导机制三个角度探索了数字化转型价值创造的内在机理。研究发现:(1)数字化转型对环境服务企业的绩效水平具有积极影响,且该影响的持续性较长;(2)数字化转型可通过改善企业经营效率间接提高企业绩效表现;(3)异质性分析还发现,数字化转型对企业绩效的推动效应受服务模式和企业所有制等微观特征因素的影响,非国有企业和实施新型服务模式的企业其数字化转型的经济效果比国有企业和传统环境服务提供商更显著。


[6]魏瑾瑞,王若彤,王晗.基于网络结构特征的大规模虚假评论群组识别[J].运筹与管理,2023,32(01):194-200.    

摘要:评论网络结构;;虚假评论群组;;网络行为得分    

关键词:目前识别虚假评论的方法主要基于评论内容的文本特征和评论者的行为特征,然而评论文本与评论者行为容易被伪造和模仿,且这两类方法只能对虚假评论逐个识别,本文考虑了虚假评论的网络结构特征,通过分析评论者的网络行为及评论者节点间的网络结构特征定义相邻节点多样性与自相似性,利用累积分布函数估计其概率并合成网络行为得分,以得分高的可疑产品为种子建立2-hop子图,筛选子图中高度相似的虚假评论候选群组,利用GroupStrainer、HDBSCAN等算法对其进行聚类合并,以发现隐藏的虚假评论群组。以亚马逊四类最畅销的产品数据集为样本进行实证分析的结果表明,文中提出的方法能够有效识别隐藏较深的大规模虚假评论群组,综合群组内容的统计特征分析发现,虚假评论群组对目标产品的攻击模式存在产品类别差异,虚假评论群组比真实评论者对目标产品具有更强的集中度,但同时也会利用其它非目标产品对自身进行伪装以弱化其可疑性。


[7]孙宝生,敖长林,王菁霞,等.基于网络文本挖掘的生态旅游满意度评价研究[J].运筹与管理,2022,31(12):165-172.    

关键词:生态旅游;;游客满意度;;在线旅游评论;;网络文本挖掘  

摘要:科学的游客满意度评价有助于生态旅游的可持续发展。随着Web 2.0技术的发展,在线旅游评论已成为游客满意度研究的重要数据来源。本文以扎龙国家级自然保护区为例,基于在线旅游评论数据和网络文本挖掘技术,构建游客满意度评价指标体系和评价模型,定量评价游客的生态旅游满意度。结果表明:游客总体满意度为0.614,达到基本满意水平。研究不仅为准确评价生态旅游目的地的游客满意度提供新视角,也为相关生态旅游政策的制定提供参考。


[8]陈艺云.基于文本信息的上市中小企业财务困境预测研究[J].运筹与管理,2022,31(04):136-143.  

关键词:财务困境;;文本分析;;管理层语调;;报道倾向    

摘要:本文通过网络爬虫获取上市中小企业相关的文本信息,包括以年报为代表的信息披露报告和互联网新闻媒体报道的文本内容,采用词袋方法基于不同特征词词表对这些文本内容进行了量化分析,并以财务变量模型为基础对文本信息量化指标在财务困境预测中的作用进行了实证检验,结果表明由信息披露报告构建的管理层语调变量以及由新闻媒体报道构建的报道倾向变量、负面报道比例变量确实可以提高财务困境模型的拟合度和预测能力,而且在对不同类型文本信息的分析应有不同的侧重点。尽管本文针对的是上市中小企业,但并未考虑市场交易信息,因而可以推广到未上市交易的中小企业。


[9]徐维军,彭子衿,张卫国,等.基于文本信息考虑投资者情绪的均值回归策略设计——以东方财富股吧发帖文本和A股市场为例[J].运筹与管理,2022,31(03):193-198.    

关键词:在线投资组合;;均值回归;;投资者情绪;;文本信息    

摘要:在当前互联网时代下,越来越多的文本信息为人们所认识。借助机器学习等技术工具,目前已能较为便捷地从海量的文本数据中挖掘出与投资者行为、情绪有关的信息。基于此,本研究探讨了利用文本信息刻画投资者情绪,并对仅利用价格信息的均值回归策略进行改进。利用东方财富股吧中发帖内容等文本数据构建投资者情绪指标,结合非理性投资行为的特征,设计新的权重转移方程,得到新的均值回归策略。最后,利用部分沪深300成分股的价格数据和股吧文本数据进行实证检验,结果表明:相比于仅利用价格信息刻画均值回归特征的策略,本研究提出的考虑投资者情绪的策略有更好的收益表现。


[10]高扬,申怡然,徐嘉熙.投资者情绪对科创板市场收益率的影响——基于文本数据挖掘视角[J].运筹与管理,2022,31(02):184-190.  

关键词:投资者情绪;;科创板;;文本挖掘;;联立方程模型;;COVID-19    

摘要:本文以科创板市场为主要研究对象,基于文本数据挖掘方法探究了新冠疫情发生前和疫情期间投资者情绪对市场收益率的影响及其作用机制。利用东方财富股吧2019年7月至2020年3月的日度科创板股票评论数据,基于Bi-LSTM深度学习技术对文本数据情感倾向进行分类,建立投资者情绪指数。通过构建双向固定效应的联立方程模型,采用2SLS方法估计投资者情绪对科创板市场收益率的作用,并检验在经济平稳运行和受新冠疫情冲击期间该作用的差异性。实证分析及稳健性检验的结果均表明,投资者情绪通过影响交易量进而影响科创板股票市场收益率,这种正向作用在1%的置信水平下显著。此外,投资者情绪对科创板收益率的影响在经济平稳运行和受新冠疫情冲击期间均保持稳健,且在新冠疫情期间作用更强。本研究成果对于新冠疫情期间我国证券市场监管层完善科创板交易机制,以及对中小投资者优化投资战略具有重要意义。


[11]那日萨,孔茸,高欢.基于深度学习的直觉模糊集隶属度确定方法[J].运筹与管理,2022,31(02):92-98.    

关键词:直觉模糊集;;隶属度;;非隶属度;;深度学习;;深层神经网络    

摘要:直觉模糊集隶属度、非隶属度和犹豫度的确定方法是直觉模糊集理论与应用研究中一个十分重要的问题,其直接影响着相关方法的可扩展性及应用结果。然而,现有方法存在主观性强、标准难以统一等问题,并且大多基于模拟数据进行实验,难以应用至实际数据。针对上述问题以及大规模非结构化数据,提出一种基于深度学习的直觉模糊集隶属度、非隶属度和犹豫度确定方法。新方法克服了传统方法的技术和思维局限,拓展了直觉模糊集相关问题的研究思路,为其实际应用提供了更多可能。


[12]郭崇慧,邢小宇,魏伟.一种基于二部图的试题知识点标注方法[J].运筹与管理,2021,30(11):71-75+112.    

关键词:教育数据挖掘;;知识点标注;;二部图    

摘要:针对在线教育中试题知识点自动标注问题,本文提出了一种基于二部图的试题知识点标注方法。首先,为了合理划分知识点粒度,本文构建了知识点知识图谱来融合知识点;其次,基于教材等语料抽取知识点与特征词二部图和试题与特征词二部图,并利用TF-IDF公式计算知识点与特征词、试题与特征词之间的边权,以构建试题-知识点二部图模型;再次,提出词频加权的相似性度量方法计算试题和知识点之间的相似度,将相似度最高的知识点作为试题知识点标签。最后,以某在线教育平台提供的高中历史试题为实验数据集进行数值实验,实验结果表明该方法的效果显著优于朴素贝叶斯、K最近邻、随机森林以及支持向量机。


[13]刘桂芳,徐维军,黄静龙,等.考虑公司信息披露情绪的欧式脆弱期权定价[J].运筹与管理,2021,30(09):164-171.    

关键词:文本挖掘;;情绪语调变量;;信用风险;;脆弱期权定价    

摘要:从公司信息披露的角度来看,定量数据直观地反映了公司的经营和财务状况,而描述性的非结构文本信息是对定量数据的有效补充。本文从公司年报中挖掘信用违约文本信息,构建语调变量情绪指标,以调控脆弱期权的违约临界值,改进经典的Klein欧式脆弱期权定价模型。研究表明:随着语调变量指标的增大,欧式看涨看跌期权价格呈递减趋势,且指标越接近1,期权价格递减速度越快,说明期权价格对负向情绪更加敏感,符合金融市场实际情况。此外,应用研究发现不考虑情绪指标的Klein模型倾向于低估期权价格,考虑公司信息披露情绪的脆弱期权定价模型能更准确地分析财务困境对信用风险的影响,结果更贴近实际情况。


[14]武森,高晓楠,何慧霞.基于双向改进余弦相似度的话题发现算法[J].运筹与管理,2021,30(02):75-83.  

关键词:网络社交平台;;话题发现;;双向改进余弦相似度;;特征向量;;增量聚类    

摘要:话题发现是网络社交平台上进行热点话题预测的一个重要研究问题。针对已有话题发现算法大多基于传统余弦相似度衡量文本数据间的相似性,无法识别各维度取值成比例变化时数据对象间的差异,文本数据相似度计算结果不准确,影响话题发现正确率的问题,提出基于双向改进余弦相似度的话题发现算法(TABOC),首先从方向和取值两个角度改进余弦相似度,提出双向改进余弦相似度,能够区分各维度取值成比例变化的数据对象,保留传统余弦相似度在方向判别上的优势,提高衡量文本相似度的准确性;进一步定义集合的双向改进余弦特征向量和双向改进余弦特征向量的加法等相关定义定理,舍弃无关信息,直接计算新合并集合的特征向量,减小话题发现过程中的时间和空间消耗;还结合增量聚类框架,高效处理新增数据。采用百度贴吧数据进行实验表明,TABOC算法进行话题发现是有效可行的,算法正确率和时间效率总体上优于其他对比算法。


[15]徐选华,张前辉.社会网络环境下保护少数意见的风险性大群体应急决策方法[J].运筹与管理,2020,29(10):49-58.    

关键词:社会网络;;少数意见;;大群体;;风险;;应急决策    

摘要:大群体决策过程中,少数意见十分重要,但考虑少数意见又有一定风险性,本文提出了一种社会网络环境下保护少数意见的风险性大群体应急决策方法。首先,利用自然语言处理技术对社交媒体中公众对突发事件的传播信息进行关键词提取,再采用TF-IDF技术提取公众关心的事件属性并确定属性权重;其次,将专家之间的联系考虑到决策当中,构建决策专家之间的社会网络关系;然后,建立少数意见的识别和风险测度机制,并定义了两个风险系数:信任风险系数和偏好风险系数,通过少数意见聚集的信任风险系数调节少数意见聚集的权重,通过偏好风险系数调节群体共识,以得到共识水平较高的大群体决策方案;最后,通过"7.1"宁乡洪灾案例分析,验证了所提方法的可行性和有效性。


[16]徐选华,刘尚龙,陈晓红.基于公众偏好大数据分析的重大突发事件应急决策方案动态调整方法[J].运筹与管理,2020,29(07):41-51.    

关键词:大数据;;应急决策;;子事件;;风险级别;;方案调整    

摘要:针对在重大突发事件应急过程中如何根据与其相关的公众偏好大数据信息来对事件进行划分以及确定事件风险大小等问题,提出了一种基于公众偏好大数据分析的两阶段聚类算法,将事件现场公众在社交媒体上发布的偏好大数据信息进行聚类分析,识别出多个与事件相关的子事件,并得出每个子事件的客观风险级别。然后,结合专家经验判断,综合得出每个子事件的风险级别,进而选择相对应的方案。在此基础上,根据实际突发事件多阶段演变特点,描述了应急决策中多事件多方案的动态调整过程,考虑方案之间的相关性和不同子事件调整方案对各风险级别子事件的应急处置效果、应对损失以及不同方案之间的转化成本等因素,得出不同情境下的最佳调整方案。通过案例分析说明了该方法的可行性和有效性。


[17]高学东,王艾.基于企业网络舆情的客户满意度分析及管理方法[J].运筹与管理,2020,29(07):232-239.  

关键词:企业网络舆情;;客户满意度;;情感分析;;尺度变换;;变尺度聚类    

摘要:社交网络平台的迅速发展,促使网络舆情成为企业获取商业情报、扩大竞争优势的重要信息来源。本文针对网络舆情环境下的企业客户关系管理问题展开研究。通过构建企业客户推动式信息反馈模型,描述了企业客户、网络用户与企业网络舆情间的联系,并依据信息反馈模型,提出变尺度聚类算法。该算法将传统聚类方法的求解过程由单一尺度分析扩展到多尺度分析,克服了实际数据聚类应用过程中的聚类结果特征不显著问题。本文选取新浪微博作为数据源,利用企业网络舆情数据集和企业客户数据集进行数据分析实验。实验结果表明,企业可以通过获取与其主营业务相关的网络舆情信息,实现客户满意度预测;同时,变尺度聚类算法结果能够为企业进一步制定销售战略和销售战术提供决策支持。


[18]郭崇慧,吕征达.一种基于集成学习的试题多知识点标注方法[J].运筹与管理,2020,29(02):129-136.  

关键词: 教育数据挖掘;;知识点标注;;文本分类;;多标签学习;;集成学习    

摘要:个性化试题推荐、试题难度预测、学习者建模等教育数据挖掘任务需要使用到学生作答数据资源及试题知识点标注,现阶段的试题数据都是由人工标注知识点。因此,利用机器学习方法自动标注试题知识点是一项迫切的需求。针对海量试题资源情况下的试题知识点自动标注问题,本文提出了一种基于集成学习的试题多知识点标注方法。首先,形式化定义了试题知识点标注问题,并借助教材目录和领域知识构建知识点的知识图谱作为类别标签。其次,采用基于集成学习的方法训练多个支持向量机作为基分类器,筛选出表现优异的基分类器进行集成,构建出试题多知识点标注模型。最后,以某在线教育平台数据库中的高中数学试题为实验数据集,应用所提方法预测试题考察的知识点,取得了较好的效果。

  • 10
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值