【科学文献计量】中英文文献标题及摘要用词情感分析与可视化

该博客介绍了如何使用Python的cntext库进行中英文文献的情感分析,包括文本词典准备、情感分析步骤、词典选择,以及对中英文摘要的情感效价分析,通过实例展示了词频统计和可视化结果。
摘要由CSDN通过智能技术生成

1 文本词典准备

新建一个ipynb文件,参照7.2.3部分,导入需要使用的python库,并将程序连接到Mysql数据库(也可以进行本地文献数据的读取,仍旧使用CNKI和Scopus数据库)。对于Scopus数据库中的数据摘要字段为空的文献记录进行剔除,读取数据输出结果如下。
在这里插入图片描述
文本数据中用词的情感分析需要将文本数据进行分词,然后对分词后的结果进行词性标注,最后根据词性的类别统计各类别的分词结果。随着文本挖掘技术的发展,已经出现了一些比较成熟词典,其中已经标注好了分词对应的词性,我们在使用时加载即可使用。本文进行用词的情感分析使用的cntext库下面的sentiment模块完成。该模块中可根据需要切换数据分析的对象(中文或者英文),也可加载内置的中英文词典(中文或者英文),具体的模块使用手册如下。该模块的功能是计算每个情感类别词在文本中的出现次数,但是强度副词和否定词汇对情绪的混合影响没有被考虑。第一个参数为传入的文本数据,第二个是指定加载的词典,第三个参数默认为分析中文数据。
在这里插入图片描述
具体的内置共有词典有14个,去掉停用词词典(STOPWORDS.pkl)和副词连词词典(ADV_CONJ.pkl),剩余12个关于文本数据情感分析的词典。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值