基于决策树方法的专利被引影响因素研究(python代码 图文 超详细)

综述

本次研究基于决策树方法对可能影响专利被引的6个影响因素(专利申请年、专利公开年、发明人数量、专利权人数量、发明人国家、专利权人国家)与专利是否被引的潜在关系进行分析。研究发现,专利申请年是其中影响最为显著的因素,而后依次是发明人数量、专利公开年数量、专利权人数量,而其他2个指标的影响效果并不明显。
在这里插入图片描述

1.数据来源与指标选取

1.1数据来源

本研究选取美国专利号为43518开头的专利数据作为研究对象,获得专利数据1507条,经过数据清理后得到454条标准化数据。

1.2指标选取

根据可能对专利被引产生影响的因素列表,拟定决策树的分析指标共6个,分别是:专利申请年PATN:APD、专利公开年PATN:ISD、发明人数量INVTSUM、专利权人数量ASSGSUM、发明人国家INVT:CNT、专利权人国家ASSG:CNT,下表是描述统计。
在这里插入图片描述

2.数据清洗与转换

2.1数据清洗

data.isnull().any(axis=0) //查看空值
data.isnull().any(axis=1)//判断数据行中是否存在缺失值
data.loc[data.isnull().any(axis=1)]//定位缺失值所在行
data3=data.dropna()
data//直接删除空值所在行
data_null_0=data.fillna(0,inplace=False
  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值