【2001-2022】企业经济政策不确定性感知数据
近年来越来越多的文献关注
宏观层面的经济政策不确定性对企业行为的影响。但Baker等(2016)的经济政策
不确定性指标(EPU)存在两个问题:
第一,EPU指数是国家层面的,在同一个时
间点上对所有企业有且仅有一个观测值,无法区分企业个体面临经济政策不确定性的差异。
第二,当使用EPU指数时,往往假设所有企业对不确定性的感知是同质的。
因此
,构造企业个体层面的对经济政策不确定性的感知指标(FEPU)具有重要的理论价值。
参照聂辉华等(2020,世界经济)的做法:
首先,通过格式转换工具把
每份上市公司年报的PDF文件转换成文本文件,使用正则表达式取出“管理层讨论与分析
”的内容,剔除所有数字、英文字母和除句号以外的所有标点符号和特殊符号。
然后,
以中文句号为分隔符把MD&A文本分割为句子,考虑到中文的语言习惯,以句子作为分析
的基本单位。假定上市公司i在年份t的年报中MD&A句子数量为S_{it},使用编
程语言Python调用jieba分词模块对每个句子进行分词,并在分词的同时剔除停
用词。为尽量降低分词带来的歧义,我们在分词时定义了用户词表,词表包括所有A股上市
公司的全称和简称、会计科目名称、后续文本处理用到的表示不确定性的词语以及与政府(
政策)相关的词语。
分词以后每个句子都变成一系列词语的组合,再对每个句子(s)
逐一进行以下操作:搜索每个句子中出现的词,如果出现表示不确定性的词,就认为是表示
不确定性的句子;如果一个句子中同时出现政府、政策等内容相关的词和表示不确定性的词
,就认为是一个表示政策不确定性的句子(P)。用经济政策不确定性句子中不确定性词语
数量(n_{s})占MD&A总词语数量(N)的比例衡量企业面临的经济政策不确定性
(FEPU)。FEPU的计算如
(1)式所示,其中I_{P}(s)是示性函数,当s
∈P时,I=1;当s不∈P时,I=0。
此外,我们额外构建了句频层面的
指标FEPU_S。
参考文献
[1] 聂辉华、阮睿和沈吉. 企业不确定性感知
、投资决策和金融资产配置[J]. 世界经济, 2020, (6): 77-9
8.
样本期间:2001-2022年
数据来源:公司信息(巨潮资讯网、C
SMAR)、词表(原文附录)
处理软件:Python
3.11
指标包括:S
code(公司代码)、Year(会计年度)、WordNum_key(关键词数量)
、Sentnum_key(关键句数量)、FEPU_W(FEPU_词频%) FEP
U_S(FEPU_句频%)
数据包括:dta文件+csv文件
数据展示:
补充内容 (2024-7-10 20:14):
已经更新至2
023年:/forum.php ..
. ;extra=#pid89906666
补充内容 (2024-7-13 1
4:22):
已经更新至2023年:
/thread-11827176-1-
1.html
下载链接:https://download.csdn.net/download/weixin_45892228/89124665
点击下载:【2001-2022】企业经济政策不确定性感知数据