【工具变量】-数据资产信息披露水平数据集(2000-2023年)

数据简介:二十大报告提出,要加快建设数字中国,加快发展数字经济。2022年12月19日,中共中央、国务院发布了《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)。该意见系统性布局了我国数据基础制度体系的“四梁八柱”,擘画了数据要素市场发展的宏伟蓝图。数据是数字经济时代的基础性资源,也是企业实现高质量发展的关键生产要素。中国信通院发布的《国家数据资源调查报告(2021)》显示,2021年我国数据产量达到6.6ZB,占全球数据总产量的10%,位列全球第二。在数据市场大发展的同时,如何有效评估、披露和管理数据资产是一大难题。2023年2月,党的二十届二中全会审议通过的《党和国家机构改革方案》提出组建国家数据局,这为数据要素市场建设和数据资产价格链的形成提供了制度保障。目前,许多企业将数据资源与日常经营深度融合,这激活了数据资源的价值,极大推动了企业数字化转型。参考牛彪和于翔等(2024)的做法,通过“种子词+Word2Vec 相似词扩充”的文本分析方法测度数据资产信息披露水平。该测度具体步骤分为三步:首先,根据中国信通院2019年发布的《数据资产管理实践白皮书(4.0版)》,“数据资产”被定义为能够为企业创造经济利益的数据资源。基于此,本文将“数据资产”和“数据资源”同时作为种子词汇。其次,通过深度学习技术和Word2Vec神经网络模型,生成与种子词汇语义相近的相似词词集,并仅保留相似度最高的前10个词汇,以确保测度的精确性,具体词汇如表1所示。此外,考虑到“基础信息”一词可能仅用于描述公司的基本情况,因此将其从相似词集中剔除。最后,通过挖掘并统计所有词汇在企业年报中每年出现的频次,并结合公式(1)计算企业的数据资产信息披露水平。 

图1.png

图2.png


数据来源:企业年报+人工整理

时间跨度:2000-2023年

数据范围:企业层面

数据形式:Excel

包含指标

股票代码公司简称年份全文总词数关键词词频数数据资产信息披露水平数据资产信息资源数据挖掘数据源大数据数据共享海量数据数据平台数据分析系统数据资源知识库



样例数据

图3.png

图4.png


参考文献:[1]牛彪,于翔,苑泽明,等.数据资产信息披露与审计师定价策略[J].当代财经,2024,(02):154-164.

下载链接https://download.csdn.net/download/T0620514/90403577

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

T0620514

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值