利用爬虫软件爬取了微博一条关于同性婚姻合法性的评论数据
目的在于想要通过对评论内容的分析了解这个话题舆论的关注
import jieba
import jieba.analyse
import numpy as np
f_path="D:\文本.txt"
with open(f_path) as f:
contents=f.read()
words=jieba.lcut_for_search(contents)
#第一种统计指定词语的词频
for word in words:
if len(word)==1:
continue
elif word=="支持" or word=="同意" or word=="进步" or word=="可以" or word=="期待":
keyword="支持"
elif word=="反对" or word=="不支持" or word=="恶心" or word=="不好" or word=="不可以" or word=="不赞成" or word=="不同意" or word=="阻止":
keyword="反对"
count[keyword]=count.get(keyword,0)+1
#第二种统计指定词语的词频
wor