基于关联分析法的美国专利技术网络挖掘（python代码图文超详细）

最新推荐文章于 2024-10-03 21:48:13 发布

Jasonzz_

最新推荐文章于 2024-10-03 21:48:13 发布

阅读量1.1k

点赞数 3

分类专栏：数据挖掘文章标签： python 大数据机器学习数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46595591/article/details/109824975

版权

本文通过Python进行大数据处理，利用Apriori算法对5000多条美国专利数据进行关联分析。设定支持度阈值为0.01，选取引用次数超50次的核心专利。数据清洗后，使用nltk库进行分词处理，最终得出专利技术网络图。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

数据清洗
Apriori
结果

数据清洗

挑选5000多条美国专利数据进行关联分析，首先设置支持度为0.01，找寻5000多条数据中被引用次数在50条以上的专利，认为其为核心专利技术

首先用excel对参考专利数据进行简单的数据清洗，并使用nltk库进行分词

import pandas as pd
from nltk import word_tokenize
data=pd.read_csv("Desktop\\python_work\\435_2.csv")
txt=data['UREF:PNO']#工作簿
print("开始")
print("分词---------------------")
words1=[]
for i in txt: 
    words = word_tokenize(str(i))
    words1.insert(0,words)
cutwords7=pd.DataFrame({
   'PNO':data['PATN:PNO'],'Time':data['PATN:ISD'],'words':words1})
cutwords7

在这里插入图片描述

Apriori

from numpy import *
# 构造数据
def loadSetData(Data):
    return Data
# 将所有元素转换为frozenset型字典，存放到列表中
def createC1(dataSet):
    C1 = []
    for t in dataSet:
        for item in t:
            if not [item] in C1:
                C1.append([item])
    C1.sort()
# 使用frozenset是为了后面可以将这些值作为字典的键
    return list(map(frozenset, C1))  # frozenset一种不可变的集合，set可变集合
# 过滤掉不符合最小支持度0.08的集合
# 返回 频繁项集列表retList 所有元素的支持度字典
def scanD(D, Ck

最低0.47元/天解锁文章

博客等级

码龄5年

67
原创

112
点赞

189
收藏

21
粉丝

关注

私信

热门文章

分类专栏

数据挖掘 3篇
管理信息系统 1篇
LeetCode每日一题 43篇
VM CentOS 1篇
k8s 9篇
golang学习 3篇
阿里云 4篇
Docker 5篇
git 1篇

展开全部收起

最新评论

阿里云ACK 托管版K8s 创建与部署应用全过程（图文）
@进行中: nginx访问不了咋整
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
m0_60317870: Error from server (InternalError): error when creating "./manifest1.3/019-katib-installs-katib-with-kubeflow-cert-manager.yaml": Internal error occurred: failed calling webhook "webhook.cert-manager.io": the server is currently unable to handle the request遇到这个报错，怎么解决 [/code]
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
米南宫: 您好想问下一台4核8G的 ECS共享型 s6 可以完成部署吗（2核4G已经CPU满了有点慌）
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
Zinggle: 博主，failed to apply: (kubeflow.error): Code 500 with message: kfApp Apply failed for kustomize: (kubeflow.error): Code 500 with message: error evaluating kustomization manifest for cluster-local-gateway Error accumulating resources: accumulating resources from '/home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks/kubernetes/application/cluster-local-gateway-1-3-1': evalsymlink failure on '/home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks/kubernetes/application/cluster-local-gateway-1-3-1' : lstat /home/ubuntu/kubeflow/.cache/manifests/manifests-1.0.2/stacks: no such file or directory，这种是什么错，它明明有，但是一执行，就被自动删除然后就报错找不到
【最新】k8s中kubeflow(v1.0)部署全过程+踩坑全集（图文）
chevalier2046: https://blog.csdn.net/Acecai01/article/details/110499012?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-1&spm=1001.2101.3001.4242 这篇又重新整理了一遍挺详细的, 可以参考参考

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。