Python学习(中文分词和wordcloud)

花了两个月学习python编程和复习H5CSS3

已经实现爬虫和数据导入,现在还剩两个阶段

今天在尝试提取关键字和生成词云

使用了jieba 和 wordcloud模块,但还未掌握停用字、并且分词不准确。

使用wordcloud模块时出现小问题但也解决了到处图片,图片中字体出现方块,原因是我字体设置错误,这个时候我只能引用系统自带的字体。

解决方案:https//blog.csdn.net/q3102885/article/details/80622348
源码查看:

"""
    测试中文分词
"""

import jieba
import wordcloud

text1 = jieba.cut_for_search("朱自清早期的散文,共25篇。可分为写实议论和叙事抒情两大类。如《生命的"
                             "价格-七毛钱》、《航船中的文明》、《白种人-上帝的骄子》、《阿河》、《"
                             "哀韦杰三君》、《旅行杂记》等直接从现实生活取材,以夹叙夹议手法抨击黑暗"
                             "社会的名篇;又如《背影》、《桨声灯影里的秦淮河》、《绿》、《荷塘月色》"
                             "、《月朦胧,鸟朦胧,帘卷海棠红》、《白水漈》等情景交融、充满诗情画意而"
                             "脍炙人口的佳作,代表了他的散文艺术的最高成就。")
w = wordcloud.WordCloud(width=1000)
w.generate(" ".join(text1))
w.to_file("C:\\Users\\S1999\\Desktop\\computerlanguage.png")
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值