【2022】管理层讨论与分析 MD&A文本及情感分析

数据范围:2010-2022年,共 42,113 条观测值
所有A股上市公司,有
dta和excel,面板数据可直接用!
指标如下:

[1] MD&A文本:文本内

[2] MD&A文本相似度(与上一年相比):关于中文文本相似度计算,首先使用
结巴分词对文本进行处理,分词过程中去掉阿拉伯数字、标点符号、图片表格。接下来使用
潜在语义索引(Latent Semantic Indexing, LSI)余弦相
似度计算法,分别计算得出 MD&A文本相似度。

[3] 正面/负面词汇数量:个数


[4] 词汇/句子/文字总量:个数

[5] 情感语调1:(正面词汇数量-负面词
汇数量)/词汇总量;数值越大,情感倾向越偏向正面积极。

[6] 情感语调2:(正
面词汇数量-负面词汇数量)/(正面词汇数量+负面词汇数量);数值越大,情感倾向越
偏向正面积极。

[7] 是否发布可持续经营非标意见:0否,1是
   

下载链接:https://download.csdn.net/download/weixin_45892228/89127844

点击下载:【2022】管理层讨论与分析 MD&A文本及情感分析

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值