关于jieba的使用

目的是通过jieba分词库统计热评中的高频词汇。

困难点在于现有的py程序下运行起来都有error,于是最后在cmd里直接运行一段统计关键词的代码。

代码来源:https://www.cnblogs.com/eastmount/p/5055906.html

代码实例(统计晴天前几条热评的关键词):

#encoding=utf-8
import jieba
import jieba.analyse


#导入自定义词典
jieba.load_userdict("1.txt")


#精确模式
text = "高一听的,那时候遇到了孩儿他妈,然后就这么幸福下来了。老子要听一辈子周杰伦!!!周杰伦,你要对那么多人的青春负责。现在想来,我们这波第一批老去的90后还是挺幸运的。在我们最好的年龄遇到了最好的华语乐坛(周杰伦巅峰、林俊杰、SHE、潘玮柏、蔡依林…)遇到了巅峰的星爷、遇到了最好的西科东艾北卡南麦。动画城陪我们成长、周杰伦陪我们成熟,我们看着星爷老去、见证科比退役。或许我们不是最好的一代,但一定是最精彩的一代。有没有85前听杰伦的来这?我84,2000年开始听刚上高一,现在都是俩孩的爹了,再听谢谢老歌好像回到了那时候的晚自习,在操场一起牵手的那个没成了孩他娘,但也没什么遗憾~第一次听是小学四年级。印在脑中的场景是永远在拖地的教室和洁癖到偏执的班主任。时过境迁,还是没机会为你翘课,最后,勇气和那个下雨天一起消失。半夜听着周董的老歌,看着大家的评论,满满的回忆。杰伦所有歌中最棒的前奏,吉他一出就抓起回忆。我在网易云音乐里看到过评论达到一万多的歌     但没有一个歌手能及你拥有两首评论6000+的歌   十六首评论2000+的歌   超过四十首评论1000+的歌并且所有这些歌  都出自你的才华     而我也只是想表达  对于很多人的一生来说     你的影响真的是无人能够替代的。2004年,高一,男班长,你很喜欢周杰伦,我存了很久的钱在你生日那天买了一张周杰伦的专辑送给你。2016年,如今,你女儿都可以上幼儿园了吧,但是你一直不知道我曾经也暗恋过你。是的,我只能暗恋,因为我也是男的。10年前高一听的,直到出了国,一天路过康乃尔的钟楼正点报时竟然用编钟演奏了这首歌,内心莫名感动。那时候总喜欢在操场上偷偷看他打篮球 广播里总是放这首歌 每天一到吃饭的时候我就坐在操场的站台上看他 春天的风暖暖的 还有夕阳西下的晚霞 那时候我们有大把的青春可以浪掷 不知道成长是什么 然而所有的时光都是被辜负被浪费后 才能从记忆里将某一段拎出 拍拍上面沉积的灰尘 感叹它才是最好的时光。肚皮上趟着个杰迷,在读这歌的评论。这首歌,出了11年,我今天第一次听,我非常非常开心今天邂逅了这首歌。"
seg_list = jieba.cut(text, cut_all=False)
print u"分词结果:"
print "/".join(seg_list)


#获取关键词
tags = jieba.analyse.extract_tags(text, topK=20)
print u"关键词:"
print " ".join(tags)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值