数据优化 | CnOpenData中国工业企业专利及引用被引用数据

中国工业企业专利及引用被引用数据

一、数据简介

   国家统计局构建了1998-2013年所有规模以上工业企业的数据,包括全部国有企业和年主营业务收入500 万元及以上的非国有工业企业。可以说,这些企业是中国经济中最重要的一群企业。然而,目前利用专利数据研究公司创新活动的论文主要集中在上市公司层面,而忽视了工业企业这一较大规模的企业的专利信息,这可能是因为中国工业企业数据库中大量不完全统一的企业名称导致的。

  为此,CnOpenData团队参考科学的数据匹配与处理方法(寇宗来、刘学悦:《中国企业的专利行为:特征事实以及来自创新政策的影响》,《经济研究》,2020年第3期)将中国工业企业与中国专利创新数据进行了细致匹配,形成了中国工业企业专利及引用被引用数据库。本数据匹配时主要依据企业名称来完成数据处理,即⼯业企业的企业名称与专利数据中的专利权⼈(专利公布则为申请⼈)之间进⾏匹配。为了最⼤化数据可⽤范围,减少数据中存在的噪音,CnOpenData团队同时对⼯业企业和专利数据中的公司名称进行了加工处理。我们考虑到股份有限公司、有限责任公司、集团公司等的不同,在匹配工作进行前删去“集团”、“有限责任公司” 、“股份有限公司” , “有限公司”、“加⼯⼚ ”、“ ⼯⼚”、“⼚”、 “省 ”、“市”、“ 县” 、“州”、“镇”、“乡”、“村”等字样,通过上述匹配过程可以获得更准确的匹配结果。此外,由于本团队持有数据量的优势,本数据的匹配数据量相较于参考文献更多。

  需要注意的是,虽然中国工业企业数据本身截止到2013年,但我们仍然选择将中国工业企业数据与截止到2021年的所有专利数据进行了匹配,这主要是因为专利的被引数据存在一定的滞后性,匹配到较新的年度可以保证专利被引数据相对完整。</

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值