随笔(1)—指定词语的词频统计

最新推荐文章于 2022-06-09 16:22:40 发布

Ahpubx

最新推荐文章于 2022-06-09 16:22:40 发布

阅读量1.3k

点赞数 1

分类专栏：菜鸟计划

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Aberton/article/details/103634064

版权

利用爬虫软件爬取了微博一条关于同性婚姻合法性的评论数据

目的在于想要通过对评论内容的分析了解这个话题舆论的关注

import jieba
import jieba.analyse
import numpy as np
f_path="D:\文本.txt"
with open(f_path) as f:
contents=f.read()
words=jieba.lcut_for_search(contents)

#第一种统计指定词语的词频
for word in words:
if len(word)==1:
continue
elif word=="支持" or word=="同意" or word=="进步" or word=="可以" or word=="期待":
keyword="支持"
elif word=="反对" or word=="不支持" or word=="恶心" or word=="不好" or word=="不可以" or word=="不赞成" or word=="不同意" or word=="阻止":
keyword="反对"
count[keyword]=count.get(keyword,0)+1

#第二种统计指定词语的词频
wor

最低0.47元/天解锁文章

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。