挖掘关联规则-文献关键词练习

这篇博客主要介绍了使用Python进行数据预处理,通过改变工作路径并读取文件,提取文献中的关键词,最终进行关联规则的挖掘。预处理工作包括了路径设置和关键词列表的构建。
摘要由CSDN通过智能技术生成

 #数据预处理工作

import os

#改变工作路径

os.chdir('C:\\Users\\apple\\Desktop\\WOSFILE')

双斜线才行(绝对引用) 单斜线(引用)单斜线不行就双斜线

#显示当前的路径

os.listdir()
['American Economic Review',
 'Econometrica',
 'Journal of Economic Literature',
 'Journal of Economic Theory',
 'Journal of Monetary Economics',
 'Journal of Political Economy',
 'Quarterly Journal of Economics',
 'Review of Economic Studies']

#逐步读取每个文件,提取keyword,储存在key_words列表里

key_words=[]
for folder in os.listdir():
    
    #找所有目录
    if folder[-4:]!='.txt':  #后四位不是.txt的忽略
        filepath="C:\\Users\\apple\\Desktop\\WOSFILE\\"+folder+"\\"  
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值