最全python词云 wordcloud 简单实例 入门_django词云显示,2024年最新分享复习经验和后台开发面经

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

text = ’ 负责公司大规模Python数据采集系统的前端和后端功能以及模块接口的开发; 参与Python和搜索系统前后技术框架。实施计划,负责技术规范的设计和实施; 不断提高输出产品的质量,性能和稳定性并对其进行优化。 完成新功能和模块的开发,学习和研究新技术,以不断满足新的产品需求; 领导团队成员进行任务分离,对接和技术评估。 至少3年以上的软件开发经验 擅长Python,J2EE,Spring MVC,Hibernate。 能够熟练掌握调试技巧以及具备迅捷解决bug的能力 熟练掌握Linux和Mysql的使用,如果掌握任何前端技能,如JQuery,EasyUI将优先录用。 掌握良好的共同技巧以及优秀的团队协作能力 特别要求:能够使用英语进行团队的交流与协作。 1、负责开发语音智能产品所需的线上服务:REST API、WebSocket API、web应用等 2、以web、后端开发工作为主,视兴趣和能力可以拓展到AI算法研究和开发 1、愿意加入创业团队,有上进心,能承受高强度工作压力 2、大学本科学历,计算机科学、软件工程、信息学或相关专业 3、曾独立完成包含前端和后端的 Web 项目(个人项目亦可) 4、熟悉 Python / Django 进行后端开发 5、熟悉 Linux 开发环境,熟悉 Mysql, Redis, Mongodb 至少一种 6、熟悉 Docker, Kubernetes 等容器管理系统 1、研究过 FreeSWITCH、Asterisk 等VOIP系统 2、研究过 SIP、H.323、MRCP、RTP 等协议 3、如有 GitHub 账号或技术博客,请在简历中写明 职位亮点 绩效奖金 五险一金 年底双薪 餐补 房补 年终分红 交通补助 加班补助 日常的数据抓取工作,参与爬虫框架的设计和改进2. 清洗和挖掘抓取的数据3. 为数据使用者提供Restful风格的API4. Git+DevOps开发,在公司的自动化运维系统部署任职要求 熟练使用PythonShell,对算法和数据结构有一定理解2. 具备Linux下的开发经验,对于定时、程序计划、并发、异步有一定了解和经验3. 有良好的编程习惯,注意编程规范,单元测试等细节4. 了解并掌握MySQL和NoSQL的使用5. 熟悉Git,DevOps,微服务开发6. 能够独立阅读英文的API文档具有以下经验者优先考虑1. 参与过爬虫项目的,对页面解析,绕过IP封锁,对抗反爬虫有一定经验者2. 熟悉AWS或其他云计算平台者3.对Apple生态了解,使用iOS设备和Mac设备,了解前端技术4.有架构设计,带团队经验 ’
cut = jieba.cut(text)
string = ’ '.join(cut)


上面是一个非常简单的分词的例子,在cut的时候也可以选择不同的参数,使用不同的模式进行分词,具体使用方法可自行百度,当然也有其他的分词包,大家可自行选择


分好词后就需要将词做成词云了,我使用的是wordcloud



from matplotlib import pyplot as plt
from wordcloud import WordCloud
wc = WordCloud(
# font_path = ‘C:\Windows\Fonts\FZSTK.TTF’, # windows下的字体路径
font_path=‘/Library/Fonts/Arial Unicode.ttf’, # 设置字体格式,如不设置显示不了中文,我这里为Mac下的字体
background_color=‘white’, #背景颜色
width=1000,
height=800,
).generate(string)
wc.to_file(‘ss.png’) # 保存图片
plt.imshow(wc) # 用plt显示图片
plt.axis(‘off’) # 不显示坐标轴
plt.show() # 显示图片


![在这里插入图片描述](https://img-blog.csdnimg.cn/20191106163703556.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM3Mjc1NDA1,size_16,color_FFFFFF,t_70)  
 这是一个十分简单的例子,文字是我随便copy的,不过这样方方正正的不怎么好看,我希望能做成网上那样有不同形状的,在wordcloud中提供了一个参数mask,他可以让你指定你想绘制的图片,不过必须是白底的,他会在你非白底的地方填充上文字,所以最终我的代码是这样的:



from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

获取当前文件路径

__file__ 为当前文件, 在ide中运行此行会报错,可改为

d = path.dirname(‘.’)

d = path.dirname(file)

读取文本 alice.txt 在包文件的example目录下

#内容为

text = “”"
Project Gutenberg’s Alice’s Adventures in Wonderland, by Lewis Carroll
This eBook is for the use of anyone anywhere at no cost and with
almost no restrictions whatsoever. You may copy it, give it away or
re-use it under the terms of the Project Gutenberg License included
with this eBook or online at www.gutenberg.org
“”"

read the mask / color image

taken from http://jirkavinse.deviantart.com/art/quot-Real-Life-quot-Alice-282261010

设置背景图片

alice_coloring = imread(‘/Users/wangyuanxin/Desktop/d4o1tzm-3550ebe7-b095-4616-9576-f2b084e95887.jpg’)

wc = WordCloud(background_color=“white”, #背景颜色max_words=2000,# 词云显示的最大词数
mask=alice_coloring,#设置背景图片
stopwords=STOPWORDS.add(“said”),
max_font_size=40, #字体最大值
random_state=42)

生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数

wc.generate(text)

wc.generate_from_frequencies(txt_freq)

txt_freq例子为[(‘词a’, 100),(‘词b’, 90),(‘词c’, 80)]

从背景图片生成颜色值

image_colors = ImageColorGenerator(alice_coloring)

以下代码显示图片

plt.imshow(wc)
plt.axis(“off”)

最后

不知道你们用的什么环境,我一般都是用的Python3.6环境和pycharm解释器,没有软件,或者没有资料,没人解答问题,都可以免费领取(包括今天的代码),过几天我还会做个视频教程出来,有需要也可以领取~

给大家准备的学习资料包括但不限于:

Python 环境、pycharm编辑器/永久激活/翻译插件

python 零基础视频教程

Python 界面开发实战教程

Python 爬虫实战教程

Python 数据分析实战教程

python 游戏开发实战教程

Python 电子书100本

Python 学习路线规划

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 18
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值