python爬歌词生成词云图_爬取每日热搜词,生成地图词云图

这是一个使用Python编写的爬虫程序,从百度风云榜抓取内地省份的热搜词,然后利用这些数据生成词云图。代码中,首先定义了城市ID列表,循环遍历获取每个城市的热搜词数据,并将其合并。接着,使用`wordcloud`库结合中国地图背景生成词云图,最后按当前日期保存图片。
摘要由CSDN通过智能技术生成

这个代码还是前几个月前毛概的实践作业写得,当时好像是要绘制一个美丽中国的地图,然后就写了这么个小爬虫。

数据来源是百度风云榜,数据只采集了内地的数据

保存的文件夹自己修改一下,或者创建一个history,不然会报错因为没加判断,保存的图片名称默认为采集日期+resou.pngimport time

import imageio

import requests

from wordcloud import WordCloud

url = 'http://top.baidu.com/region/singlelist'

'''

省份热搜词

'''

# 城市列表

list = [928, 934, 911, 904, 909, 913, 925, 912, 902, 920, 921, 927, 908, 906, 930, 922, 916, 903, 907, 905, 919, 918,

910, 914, 901, 929, 924, 923, 931, 932, 933, 926, 915, 917, ]

result = {}

# 循环获取信息

for i in list:

data = {

'boardid': '2',

'divids[]': i,

}

Html = requests.post(url=url, data=data).json()

x = str(i)

data = html['topWords'][x]

lists = {i['keyword']: i['searches'] for i in data}

result.update(lists)

# pic为背景形状

Pic = imageio.imread('chinamap.png')

# 实例化词云

w = WordCloud(width=1000, height=700, font_path='simhei.ttf', background_color='white', mask=Pic, scale=15)

# 将爬取的数据给词云

w.fit_words(result)

# 将结果根据时间写到图片

now = time.strftime('%Y-%m-%d', time.localtime())

w.to_file(f'history/{now}resou.png')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值