企业家注意力配置(2007-2023)
1864
数据简介
2024年政府工作报告提出:“要加快发展新质生产力,充分发挥创新主导作用。”党的二十大报告也指出“强化企业科技创新主体地位”。大量研究发现,企业家注意力配置会对企业创新绩效产生重要影响,由于注意力是稀缺有限的资源,企业家注意力配置的差异是企业创新绩效差异的重要原因。因此,企业家注意力配置是分析企业创新变化的重要理论视角。
根据内容和时间维度两方面,注意力配置分为内容和时间两个层面,其中内容配置是企业家基于任务维度将其注意力在经营管理多任务中的不同配置,而时间配置则是企业家基于时间维度将其注意力在过去、现在、未来多时间点的不同配置,也被称为不同的时间焦点。本数据参考余振等(2024)的做法,构建注意力配置指标。
(一)注意力内容配置
公司年报能有效反映企业家的特质及状态,参照蒋艳辉和冯楚建(2014)的研究,选择对上市公司年报中的管理层分析与讨论章节(MD&A)进行文本分析。
首先构建“创新注意力”词集。参照胡楠等(2021)和Brochet等(2015),通过机器学习Word2vec这一方法寻找近义词,缓解人为定义词表的主观性和通用同近义词工具的弱相关性。利用Word2vec模型对文本语料进行训练后,生成词向量空间,为每个词分配一个向量。在向量空间中,距离越近的词意思越近,可以通过两词的距离计算相似性。
具体筛选词集方式如下:
第一步,选择既往中文文献中曾用过的“创新注意力”词集作为基础词。
第二步根据Word2vec中的CBOW模型对中文年度财务报告语料进行训练,生成词向量空间,并在词向量空间中,对基础词的相似词进行筛选。筛选标准为:财报文本语料中出现频次在1000次以上,且和基础词频相似度在30%以上的拓展词。
第三步为邀请了3名业界和学术界专家对CBOW模型得到的相似词进行人工核查,并筛选出“创新注意力”拓展词集。
筛选出基础词集和拓展词集后,利用jieba分词库对年报中的MD&A部分进行中文分词,计算词集中词汇总词频占MD&A总词频的比例并乘以100,得到企业家创新注意力配置指标。
(二)注意力时间配置
跟上述做法相似,分三个步骤选取表征当下和表征未来的词集。
第一步参照陈守明和胡媛媛(2016)的做法,采用“现在”“此时”“此刻”“当下”“当前”“近期”“目前”作为表征关注当下的基础词,采用“未来”“即将”“将来”“将要”“接下来”“今后”作为表征将来的基础词。
第二步基于Word2vec中的 CBOW模型构造词向量空间,并在其中寻找近义词,筛选出词频数在1000词以上,和基础词相似度在30%以上。第三步邀请3名业界和学术界专家 CBOW模型得到的相似词进行人工核查,并筛选出包括“现在”“此时”等表征当下的词集,并得到包括“将来”“将要”等表征未来的词集。
筛选出词集后,分别基于表征当下和表征未来的词集进行文本分析,并利用词典法对每家企业的年报中MD&A部分进行词频分析计算词集词频数占MD&A总词数的比例,分别得到表征当下和未来的注意力时间配置指标。
数据来源
由数据皮皮侠团队人工整理,全部内容真实有效。
时间跨度
2007-2023年
数据范围
中国A 股上市公司
数据形式
数据格式为Excel形式
数据指标
数据展示
参考文献
[1]余振,李元琨,李汛.外部关税冲击、企业家注意力配置与创新发展[J].世界经济,2024,47(6):65-94.
声明:本数据由数据皮皮侠团队整理,仅用于学术研究