基于关联分析法的专利发明人合作关系探究（python代码图文超详细）

最新推荐文章于 2024-10-03 21:48:13 发布

Jasonzz_

最新推荐文章于 2024-10-03 21:48:13 发布

阅读量1.2k

点赞数 3

分类专栏：数据挖掘文章标签： python 大数据数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46595591/article/details/109822121

版权

本文通过Python的nltk库对6000多条物理领域专利的发明人进行分词处理，接着利用Apriori算法计算支持度大于0.002的重要发明人，并找出支持度大于0.2的高关联度发明人组合，揭示发明人之间的合作模式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

分词
Apriori
结果

分词

应用python中nltk包分词

首先在找到国际G（物理领域）的所有专利，最终得到6000多条专利数据。接下来应用python中nltk包对专利发明人进行分词

import pandas as pd
from nltk import word_tokenize
#将编码utf-8改成gbk
data=pd.read_csv("Desktop\\python_work\\diming_data.csv",encoding='gbk')
txt=data['INVT']#工作簿
print("开始")
print("分词---------------------")
words1=[]
for i in txt: 
    words = word_tokenize(str(i))
    words1.insert(0,words)
cutpersons=pd.DataFrame({
   'cut_persons':words1})
cutpersons

在这里插入图片描述

Apriori

（1）计算支持度大于0.002的所有专利发明人，即寻找在物理领域申请专利12项以上的发明人，并认为其为该领域的重要发明人

from numpy import *
# 构造数据
def loadSetData(Data):
    return Data
# 将所有元素转换为frozenset型字典，存放到列表中
def createC1(dataSet):
    C1 = []
    for t in dataSet:
        for item in t:
            if not [item] in C1:
                C1.append([item])
    C1.sort()
# 使用frozenset是为了后面可以将这些值作为字典的键
    return list(map(frozenset, C1))  # frozenset一种不可变的集合，set可变集合
# 过滤掉不符合最小支持度0.08的集合
# 返回 频繁项集列表retList 所有元素的支持度字典
def scanD(D, Ck, minS):
    ssCnt = {

最低0.47元/天解锁文章

博客等级

码龄5年

67
原创

112
点赞

189
收藏

21
粉丝

关注

私信

热门文章

分类专栏

数据挖掘 3篇
管理信息系统 1篇
LeetCode每日一题 43篇
VM CentOS 1篇
k8s 9篇
golang学习 3篇
阿里云 4篇
Docker 5篇
git 1篇

展开全部收起

最新评论

阿里云ACK 托管版K8s 创建与部署应用全过程（图文）
@进行中: nginx访问不了咋整
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
m0_60317870: Error from server (InternalError): error when creating "./manifest1.3/019-katib-installs-katib-with-kubeflow-cert-manager.yaml": Internal error occurred: failed calling webhook "webhook.cert-manager.io": the server is currently unable to handle the request遇到这个报错，怎么解决 [/code]
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
米南宫: 您好想问下一台4核8G的 ECS共享型 s6 可以完成部署吗（2核4G已经CPU满了有点慌）
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
Zinggle: 博主，failed to apply: (kubeflow.error): Code 500 with message: kfApp Apply failed for kustomize: (kubeflow.error): Code 500 with message: error evaluating kustomization manifest for cluster-local-gateway Error accumulating resources: accumulating resources from '/home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks/kubernetes/application/cluster-local-gateway-1-3-1': evalsymlink failure on '/home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks/kubernetes/application/cluster-local-gateway-1-3-1' : lstat /home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks: no such file or directory，这种是什么错，它明明有，但是一执行，就被自动删除然后就报错找不到
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
chevalier2046: https://blog.csdn.net/Acecai01/article/details/110499012?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-1&spm=1001.2101.3001.4242 这篇又重新整理了一遍挺详细的, 可以参考参考

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。