在前文,利用上市公司年报全文,对人工智能的相关词频进行了统计。本期进一步对MD&A文本进行统计
参考《管理世界》中姚加权(2024)的做法,团队根据上市年报MD&A文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
MD&A文本筛选:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选,2021-2023年主要在“管理层讨论与分析”中提取
一、数据介绍
数据名称:上市公司人工智能-MD&A报告73个词频、文本统计
数据范围:A股上市公司
数据年份:2001-2023年
样本数量:60099条,83个变量
数据来源:上市公司“管理层讨论与分析”文本
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
二、整理说明
➤爬取2001-2023年上市公司年报
➤将MD&A报告文本整理为面板数据
➤统计MD&A报告文本的文本长度
➤统计MD&A文本中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
三、指标说明
四、数据概览
企业数目
上市公司人工智能词频统计明细-excel版
上市公司人工智能词频统计明细-stata版
【下载→
方式一(推荐):主页↓个人↓简介
经管数据库-CSDN博客
方式二:数据下载地址汇总-CSDN博客