管理层讨论与分析(MD&A)数据大全1999-2021年 语料、文本分析Excel格式

管理层讨论与分析(MD&A)数据大全


管理层讨论与分析数据库
是针对上市公司财务报告中管理层讨论与分析模块而建立的专业数据库,数据库涵盖了从1
999年至今所有上市公司的年报、半年报和季报中与经营讨论与分析相关的数据资料,并
采用人工智能算法对文本内容涉及的正面、负面词汇进行判断识别。其中,正面词汇和负面
词汇的判断基础主要是根据Tim Loughran and Bill McDona
ld(2011)的英文正负面词典翻译为中文词典,再结合中文语境进行扩充和完善得到
。可以有效帮助使用者分析上市公司所披露和预期的经营文本数据。


MD&A文本极
具研究价值,研究内容广泛,比如公司治理、审计、风险识别、证券投资、股价预测、公司
金融等等。研究人员可通过自然语言处理技术提取和分析MD&A的情感分析、自利性归因
、竞争和风险分析、关键词提取和蹭热点分析、可读性分析等等。欢迎会计学、金融学、产
业经济学等研究方向的学者购买使用。


1、数据量情况
会计年度    经营分析时
间    样本量
2000    2000-06-30    

665


2000    2000-
12-31    

480


2001    2001-06-30    

1007


2
001    2001-12-31    

1142


2002    2002-06-30    


1160


2002    2002-12-31    

1187


2003    2
003-06-30    

1225


2003    2003-12-31    

125
5


2004    2004-06-30    

1328


2004    2004-1
2-31    

1342


2005    2005-06-30    

1353


2
005    2005-12-31    

1337


2006    2006-06-30    


1339


2006    2006-12-31    

1423


2007    2
007-06-30    

1446


2007    2007-12-31    

175
9


2008    2008-06-30    

1569


2008    2008-1
2-31    

1624


2009    2009-06-30    

1586


2
009    2009-12-31    

1782


2010    2010-06-30    


1884


2010    2010-12-31    

2159


2011    2
011-06-30    

2196


2011    2011-12-31    

241
7


2012    2012-06-30    

2019


2012    2012-1
2-31    

2478


2013    2013-06-30    

1854


2
013    2013-12-31    

2987


2014    2014-06-30    


2227


2014    2014-12-31    

2679


2015    2
015-06-30    

2614


2015    2015-12-31    

286
9


2016    2016-06-30    

2796


2016    2016-1
2-31    

3147


2017    2017-06-30    

3287


2
017    2017-12-31    

3575


2018    2018-06-30    


3492


2018    2018-12-31    

3588


2019    2
019-06-30    

3607


2019    2019-12-31    

398
1


2020    2020-06-30    

3887


2020    2020-1
2-31    

4229


2021    2021-12-31    

4665

2、指标说明


股票代码

    

公司股票代码


公司简称


    

公司简称


会计年度

    

所属会计年度


经营分析时间


    

层讨论与分析的发布时间


经营讨论与分析内容

    

层讨论与分析的
详细内容


正面词汇数量

    

层讨论与分析内容中识别出的正面词汇数量

负面词汇数量

    

层讨论与分析内容中识别出的负面词汇数量



子数量

    

层讨论与分析内容的句子数量


文字数量

    

层讨论与分
析内容的文字数量

语调 =(正面词汇数-负面词汇数)/(正面词汇数+负面词
汇数),
取值介于[-1,+1]该数值越高,表明管理层整体用词越积极正面,对公司
目前经营现状、未来业绩和行业发展前景持积极乐观的态度。


3、数据截图


4、相关文献


[1] 孟庆斌;杨俊华;鲁冰. 管理层讨论与分析披露
的信息含量与股价崩盘风险——基于文本向量化方法的研究. 《中国工业经济》, 20
17年12期


[2] 周楷唐;姜舒舒;麻志明. 政治不确定性与管理层自愿业绩预
测.《会计研究》, 2017年10期


[3] Xiaobei Huang, X
i Li, Senyo Tse, Jennifer Wu Tucker. The
 effects of a mixed approach toward mana
gement earnings forecasts: Evidence from
 China. Journal of Business Finance & Ac
counting, Accepted manuscript online:20 
December 2017


5、数据购买


附件包含两份文件

管理层
讨论与分析.xlsx  包含经营讨论与分析内容的数据比较大717M,放在百度网盘
地址上,附件里面提供网盘地址和提取码

包含MD&A文本内容,可通过Python
的jieba分词语言对数据进行分词或者进行其他处理,构造更多结构化数据。
   

下载链接:https://download.csdn.net/download/weixin_45892228/89146381

点击下载:管理层讨论与分析(MD&A)数据大全1999-2021年 语料、文本分析Excel格式

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值