上市公司创新信息披露（1991-2023）

最新推荐文章于 2025-05-13 09:22:29 发布

数据皮皮侠AI

最新推荐文章于 2025-05-13 09:22:29 发布

阅读量180

点赞数 5

文章标签：人工智能数据库大数据业界资讯创业创新

本文链接：https://blog.csdn.net/2501_91959248/article/details/147888993

版权

上市公司创新信息披露（1991-2023）

1863

数据简介

与传统词典法不同,本文采用“种子词集+Word2Vec相似词扩充”方法构建描述性创新信息指标。参考相关文献[11,28],对年报多次研读校验得到种子词集。相较于传统词法,Word2Vec神经网络模型可以根据语义信息将词汇转换为多维向量,并通过计算向量的相似度得到相似词。本文采用其中的CBOW(ContinuousBag-of-wordsModel)模型对中文语料进行训练。描述性创新关键词如见表1所示。

在构建描述性创新关键词词集后,本文以年报中描述性创新信息的总词频/年报总词频衡量描述性创新信息披露水平。在此基础上,本文采用当年除目标企业外其余同行企业描述性创新信息披露水平的算术平均数衡量同行描述性创新信息披露水平(Inno_Dis)。