爬虫 wordcloud操作

该博客通过Python的jieba分词库处理SQLite数据库中电影简介,结合wordcloud和matplotlib创建词云图。选用特定图片作为词云形状,并使用兰亭特黑长简字体,最终将词云保存为图片。
摘要由CSDN通过智能技术生成

import jieba   #分词
from matplotlib import pyplot as plt    #绘图
from wordcloud import WordCloud     #词云
from PIL import Image   #图片处理
import numpy as np   #矩阵运算
import sqlite3    #数据库


#准备词云所需要的文字(词)
con = sqlite3.connect('movie.db')
cur = con.cursor()
sql = 'select instroduction from main.movie250'
data = cur.execute(sql)
text= ""
for item in data:
    text = text +item[0]
#print(text)

cur.close()
con.close()

#分词
cut = jieba.cut(text)
string = ' '.join(cut)
print(len(string))

img = Image.open(r'.\static\assets\img\tree.jpg')  #打开遮罩图片

img_array = np.array(img)   #将图片转换为数组

wc = WordCloud(
    background_color='white',
    mask = img_array,
    font_path="兰亭特黑长简.TTF"
)
wc.generate_from_text(string)

#绘制图片
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('off')

#plt.show()  #现实生成的词云图片

#输出词云图片到文件
plt.savefig(r'.\static\assets\img\word.jpg')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

疯丰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值