python爬歌词生成词云图_爬取每日热搜词，生成地图词云图

最新推荐文章于 2022-05-14 21:30:01 发布

weixin_39950010

最新推荐文章于 2022-05-14 21:30:01 发布

阅读量283

点赞数

文章标签： python爬歌词生成词云图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39950010/article/details/111453569

版权

这是一个使用Python编写的爬虫程序，从百度风云榜抓取内地省份的热搜词，然后利用这些数据生成词云图。代码中，首先定义了城市ID列表，循环遍历获取每个城市的热搜词数据，并将其合并。接着，使用`wordcloud`库结合中国地图背景生成词云图，最后按当前日期保存图片。

摘要由CSDN通过智能技术生成

这个代码还是前几个月前毛概的实践作业写得，当时好像是要绘制一个美丽中国的地图，然后就写了这么个小爬虫。

数据来源是百度风云榜，数据只采集了内地的数据

保存的文件夹自己修改一下，或者创建一个history，不然会报错因为没加判断，保存的图片名称默认为采集日期+resou.pngimport time

import imageio

import requests

from wordcloud import WordCloud

url = 'http://top.baidu.com/region/singlelist'

'''

省份热搜词

'''

# 城市列表

list = [928, 934, 911, 904, 909, 913, 925, 912, 902, 920, 921, 927, 908, 906, 930, 922, 916, 903, 907, 905, 919, 918,

910, 914, 901, 929, 924, 923, 931, 932, 933, 926, 915, 917, ]

result = {}

# 循环获取信息

for i in list:

data = {

'boardid': '2',

'divids[]': i,

}

Html = requests.post(url=url, data=data).json()

x = str(i)

data = html['topWords'][x]

lists = {i['keyword']: i['searches'] for i in data}

result.update(lists)

# pic为背景形状

Pic = imageio.imread('chinamap.png')

# 实例化词云

w = WordCloud(width=1000, height=700, font_path='simhei.ttf', background_color='white', mask=Pic, scale=15)

# 将爬取的数据给词云

w.fit_words(result)

# 将结果根据时间写到图片

now = time.strftime('%Y-%m-%d', time.localtime())

w.to_file(f'history/{now}resou.png')

weixin_39950010

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。