《统计研究》文本分析技术最新进展总结盘点

《统计研究》使用文本分析研究企业数字化转型、年报文本增量信息、投资者情绪、Leximancer文本挖掘、扩展CPI预测种子关键词的文本挖掘技术、货币政策预期引导、货币政策沟通指数,具有巨大参考学习价值。

杨彦欣,高敏雪.企业数字化转型:概念内涵、统计测度技术路线和改进思路[J].统计研究,2024,41(03):62-73.DOI:10.19343/j.cnki.11-1302/c.2024.03.005.

【摘要】数字化转型是数字经济的重要推力,是企业实现提质降本增效目标、发现并创造新价值的必由之路。高质量的统计测度是研究数字化转型作用机制的基础,学界和业界目前已经就这一问题形成成熟度模型构建、文本分析和数字化无形资产占比测算三条主要技术路线,政府部门亦在指标体系构建方面有所作为。本文首先介绍数字化转型的概念内涵和属性;再对三条统计测度技术路线进行系统概述,围绕测度框架和数据来源评价其各自优劣,选出首选路线;最后分别面向学界业界和政府统计部门提出后续改进思路。本文试图在提高企业数字化转型统计测度质量方面做出理论贡献,以期为后续有关企业数字化转型的研究提供支持。

【关键词】企业数字化转型;统计测度;成熟度模型;文本分析;数字化无形资产

李鑫,徐琼,王核成.企业数字化转型与绿色技术创新[J].统计研究,2023,40(09):107-119.DOI:10.19343/j.cnki.11-1302/c.2023.09.008.

【摘要】以高质量发展为引领的数字化转型战略能否推动企业绿色技术创新,是数字经济时代下的热点话题。基于2007—2021年我国沪深A股上市公司数据,本文实证检验了企业数字化转型对绿色技术创新的影响。研究结果表明,数字化转型能够有效推动企业绿色技术创新。机制检验证实,优化人力资本结构、降低信息不对称并强化市场正面预期、改善公司治理水平是数字化转型提升企业绿色技术创新的核心机制。异质性分析表明,在国有企业、低融资约束和技术密集型企业,以及低碳试点城市和东部地区,企业数字化转型对绿色技术创新的推动作用更为显著。本研究为理解企业数字化转型驱动绿色技术创新提供经验证据,并为我国推动数字化转型以促进经济高质量发展提供理论和实践参考。

【关键词】企业数字化转型;绿色技术创新;数字经济;文本分析法;

李成明,周迪,董志勇.资本市场开放推动企业数字化转型了吗?——基于准自然实验和文本分析方法[J].统计研究,2023,40(08):96-109.DOI:10.19343/j.cnki.11-1302/c.2023.08.008.

【摘要】企业数字化转型是畅通国内大循环的重要举措,也是推动高质量发展的关键路径,但现有文献对企业数字化转型的动因关注较少。本文运用文本分析方法对2009—2021年上市公司年报进行分析,构建了企业数字化转型指数,并基于沪港通准自然实验研究了资本市场开放对企业数字化转型的影响及其机制。实证结果显示,资本市场开放显著推动了企业数字化转型,且这一结论在进行一系列稳健性检验后依然成立。机制分析发现,资本市场开放主要通过改变企业信息披露行为和促进企业长期价值回归两条路径推动企业数字化转型,即企业数字化转型兼具策略性和实质性。异质性分析发现,资本市场开放的数字化转型效应在非国有企业、高新技术产业、融资约束较高企业和管理层权力较大的企业中表现更明显。本文剖析了“开放”与“转型”之间的关系,为企业数字化转型的影响因素研究提供了新视角,也为开放进程中加快企业数字化转型以促进经济高质量发展提供了经验证据。本文结论说明,通过资本市场开放融入国际大循环,可以加快企业数字化转型以畅通国内大循环,有助于构建以国内大循环为主体、国内国际双循环相互促进的新发展格局。

【关键词】数字化转型;资本市场开放;新发展格局;文本分析;准自然实验;

郭松林,宁祺器,窦斌. 上市公司年报文本增量信息与违规风险预测——基于语调和可读性的视角[J]. 统计研究. 2022,39(12).

【摘要】本文基于2006—2019年我国沪深A股上市公司年度财务报告的文本数据,探讨并检验了年报文本语调和可读性特征与公司违规风险之间的经济关联,主要有三点发现:第一,随着年报文本负面语调指标的提升,可读性指标的降低,公司违规概率和违规的严重程度显著增大;第二,机制检验结果表明,年报语调和可读性指标能够传递公司财务困境以及经营风险的增量信息,进而有助于识别公司潜在的违规风险;第三,当企业信息透明度较低、盈利能力较差时,负面的文本特征指标可以视为对业绩指标的补充验证,揭示出公司面临更大的违规动机。同样,在企业年报可读性较差时,负面的语调指标与之形成了信息强化效应,两类文本指标的交互验证能够更为有效地识别公司的违规动机。上述结论表明,上市公司年报文本数据能够为监管部门创新监管方式,提高监管效率,防范化解风险提供新的思路和方法

【关键词】语调;可读性;公司违规;信息强化效应;金融监管

崔炎炎, 刘立新. 网络舆情赋能金融科技股票收盘价预测研究[J]. 统计研究, 2022, 39(6):13.

【摘要】金融科技发展进程中,网络舆情或许能给该行业指标数据的预测做出贡献,但相关研究尚不充分。本文将万得(wind)数据库中金融科技股票的交易数据作为金融科技行业的缩影,利用情感分类模型对爬取的11万余条微博文本中的投资者情绪进行挖掘。研究发现:负向投资者情绪占比对84只金融科技股票样本的平均收盘价存在负向影响,且具有长期稳定的均衡关系。进而,本文构建了以负向投资者情绪、工作日变量及其他金融科技股票量化指标数据为模型输入、预测金融科技股票平均收盘价指标数据的长短时间记忆神经网络模型(Long Short-Term Memory,LSTM)。结果表明:引入投资者负向情绪占比后,实验组LSTM模型比对照组的预测评价指标结果更加优秀,表明网络舆情对金融科技股票收盘价预测具有重要作用;实验组LSTM模型在不同预测期限上的预测效果评价指标均优于其他对照模型(随机森林、多层神经网络和支持向量回归模型),进一步证实了其良好的预测性能和模型稳健性。本文研究进一步丰富了自然语言处理和深度学习技术在金融科技领域的研究,为金融科技行业相关指标数据的预测提供了新的思路

【关键词】LSTM;投资者情绪;金融科技;股票收盘价

游家兴,魏珊珊,刘淳. 流水不腐,户枢不蠹:创新型地方政府与经济高质量发展——基于僵尸企业的研究视角[J]. 统计研究. 2021,38(10).

【摘要】与出境游的蓬勃发展态势相比,我国入境游发展较低迷,亟待提振。本研究基于文本挖掘技术对7万多条入境游客评论进行了深度分析,通过评论分层和因素提取,提炼和归纳了根植于大数据的入境游客旅游体验影响因素,基于这一理论框架对不同满意度游客群体的体验感知进行分层过滤和感知差异深描,准确揭示了游客体验感知规律与差异。研究发现,不同满意度游客体验感知存在显著差异,主要聚焦在人际性、体验性和结构性三类因素上,同时还受到人口和景区特征因素的影响。这一探索性研究为大数据背景下的旅游体验研究提供了新的思路,对已有旅游体验影响因素的理论猜想进行了补充完善及交叉验证,也为旅游目的地管理实践提供了有价值的参考

【关键词】旅游体验;游客满意度;Leximancer文本挖掘;旅游大数据

唐晓彬, 董曼茹, 徐荣. 大数据背景下CPI预测问题的文本挖掘技术设计与应用[J]. 统计研究, 2021(008):038.

【摘要】本文创新地将半监督交互式关键词提取算法词频-逆向文件频率(Term FrequencyInverse Document Frequency,TF-IDF)与基于Transformer的双向编码表征(Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术。采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT"两段式"检索过滤模型深入挖掘文本信息并匹配关键词,实现CPI预测关键词深度上的扩展,从而构建了CPI预测的关键词库。在此基础上,本文进一步对文本挖掘技术特征扩展前后的关键词建立预测模型进行对比分析。研究表明,相比于传统的关键词提取算法,交互式TF-IDF算法不仅无需借助语料库,而且还允许种子词的输入。同时,BERT模型通过迁移学习的方式对基础模型进行微调,学习特定领域知识,在CPI预测问题中很好地实现了语言表征、语义拓展与人机交互。相对于传统文本挖掘技术,本文设计的文本挖掘技术具有较强的泛化表征能力,在84个CPI预测关键种子词的基础上,扩充后的关键词对CPI具有更高的预测准确度和更充分的解释性。本文针对CPI预测问题设计的文本挖掘技术,也为建立其他宏观经济指标关键词词库提供新的研究思路与参考价值

【关键词】提取;CPI预测;文本挖掘技术;交互式TF-IDF算法;BERT模型

曾守桢, 苏为华, 张崇辉. 统计学类本科专业课程体系的国际比较——基于1072个专业的文本挖掘分析[J]. 统计研究, 2020, 37(10):14.

【摘要】本文利用爬虫技术建立了1072个统计学类本科专业的课程数据库,并通过文本挖掘技术构造了课程结构的一致性测度方法和课程内容的圆形网络图,实现了课程体系的国际比较。主要结论有:①统计学类专业主要分布在中国、美国、英国、法国、俄罗斯、加拿大和韩国等国家;②经济统计专业课程体系呈现"统计方法占主导,经济学、数学、计算机和其他"依次递减的特征,其中中国与欧洲地区的课程设置较为类似,偏向于开设计量经济、宏观经济等课程,而其他地区更偏向于商务、软件等课程;③统计学(理学)专业遵循"统计方法 -数学-计算机-其他-经济学"递减的课程体系,除统计学、数学分析、概率论等课程外,中国与其他地区在课程设置上存在明显差异;④应用统计专业课程体系以"统计方法和经济学"为主,主要开设统计学、数学分析、计量经济学、时间序列分析等课程;⑤生物统计和社会统计专业以北美洲为主,中国主要开设"统计方法类+生物类"课程,而在北美洲地区中数学类课程占绝对比重。据此,提出了经济统计应增强经济学属性与学科交叉属性,统计学(理学)应相宜选择提升数学性或工具性以及应用统计课程设置应更注重中国特色等建议

【关键词】统计学;课程体系;文本挖掘;国际比较

王韧,刘于萍. 预期引导,政策冲击与股市波动*——基于文本分析法的异质性诊断[J]. 统计研究, 2021, 038(012):118-130.

【摘要】防范股票市场异常波动是维护金融稳定和防控金融风险的关键一环。货币政策实践中,预期引导与政策冲击对股市波动的实际影响和传导机制迥然不同。现有文献对两者之于股票市场波动的异质性影响多有讨论,但分歧明显。基于2005年到2019年中国人民银行各季度《货币政策执行报告》和《货币政策大事记》,本文分别构建表征货币政策预期引导强度和实际操作频度的代理变量,对上述指标之于同期A股市场主要行业指数的波动性影响做了多维诊断和系统梳理。研究发现,第一,预期引导效应和政策冲击效应对于股票市场波动性的影响存在显著异质性特征,预期引导有助于平抑市场波动,而频繁调控则会放大股市波动。第二,预期引导的明确性会制约其对股市波动的平缓作用,货币调控意愿的表达越明确,越有助于平抑股票市场波动;而更坚决的"严厉型"表述比态度相对温和的"温和型"表述能够更显著地平抑股票市场波动。第三,实际操作频度对股市波动的放大作用受制于具体调控方向,宽松型调控的频率上升仅会小幅放大股市波动,而紧缩型货币调控则会大幅抬升股市波动性。由此,从平抑股市异常波动、维持金融稳定的角度出发,强化货币政策的预期引导比相机抉择的频繁调控更为重要;在预期引导过程中,应当增强调控意愿表达的明确性和坚决性,以限制其对金融市场运行带来的扰动

【关键词】预期引导;政策冲击;股市波动;调控模式

顾文涛, 王儒, 郑肃豪,等. 金融市场收益率方向预测模型研究——基于文本大数据方法[J]. 统计研究, 2020, 37(11):12.

【摘要】金融市场的发展关系着一国的经济命脉,而股票市场作为金融市场的重要组成部分,对其收益率的研究也一直都是学术界的热点。财经新闻常被认为蕴含着丰富的信息,其中所包含的情感信息作为影响投资者投资决策的重要因素之一,对股票收益率也具有一定的影响。故本文构建了适用于金融投资领域的财经新闻情感词典来对财经新闻进行文本分析,同时构造了新的预测模型:将财经新闻文本中所含的情感量化为情绪指数并与时变密度函数相结合,得到时变加权密度模型。并在此基础上以模型评分为权重组合多个预测模型构建出评分加权模型用于股票收益率预测。结果显示,加入情绪指数能有效提高模型预测能力,而评分加权模型的预测能力则在此基础上更进一步,在准确率以及评分规则上基本达到双重最优

【关键词】方向预测;情绪指数;评分加权

林建浩, 陈良源, 宋登辉. 如何测度央行行长的口头沟通信息——一种基于监督学习的文本分析方法[J]. 统计研究, 2019, 36(8):16.

【摘要】本文以2003年1月至2018年8月中国央行行长所有口头沟通内容为文本基础,生成央行行长沟通这一特定领域的专用词典,进而使用短语数量加权的方法分别构造货币政策沟通指数和经济形势沟通指数。其中,货币政策沟通指数与实际基准利率和存款准备金率的变动具有高度相关性,而经济形势沟通指数可以作为经济基本面的信号器。进一步,本文基于监督学习方法,通过训练子样本词典得到具有倾向的短语及其概率分布,利用文本分类器对新的沟通文本进行自动分类,最终对新样本进行指数计算。子样本的监督学习与全样本信息具有一致的结果,表明本文的央行行长口头沟通测度具有可复制性和可延展性

【关键词】央行沟通;词典分析;监督学习

  • 19
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
文本分析技术在当今社会已经得到广泛应用,并且在未来也有着巨大的发展潜力。以下是关于文本分析技术应用现状及未来展望的一些观点: 1. 情感分析:文本分析技术可以帮助企业、政府等机构了解公众对于产品、服务或政策的情感倾向。通过对大量文本数据进行情感分析,可以更准确地把握公众的态度和情绪,提供决策支持。 2. 舆情监测:随着社交媒体和网络的普及,人们在网络上发表的言论数量庞大,文本分析技术可以实时监测和分析这些言论,帮助政府、企业等机构了解公众对特定事件、产品或品牌的关注程度,及时做出反应。 3. 垃圾邮件过滤:文本分析技术可以通过识别关键词、语法结构等特征,对电子邮件进行自动分类,将垃圾邮件过滤掉,提高用户的工作效率。 4. 智能客服:利用文本分析技术,可以将大量的客户问题进行自动分类和回复,提高客户服务的效率和满意度。 5. 情报分析:在安全领域,文本分析技术可以帮助情报部门快速处理大量的情报文本,识别关键信息、发现威胁,并提供预警和决策支持。 未来,随着人工智能技术的不断发展和突破,文本分析技术将变得更加智能化和自动化。例如,通过深度学习和自然语言处理技术的进步,文本分析系统可以更准确地理解用户的意图和情感,提供更加个性化和精准的服务。同时,结合其他技术如图像识别、语音识别等,文本分析技术也将在更多领域发挥作用,实现多模态数据的综合分析。 总的来说,文本分析技术在应用现状已经取得了一定的成就,未来的发展前景也非常广阔。它将继续推动信息处理和决策支持的创新,为各行各业带来更高效、智能的解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值