python爬虫抓取某平台的文章标题，进行词频统计并生成词云

最新推荐文章于 2024-06-09 23:55:35 发布

写python的鑫哥

最新推荐文章于 2024-06-09 23:55:35 发布

阅读量835

点赞数

分类专栏：爬虫实战进阶文章标签：爬虫 python 词云

本文链接：https://blog.csdn.net/Leexin_love_Ling/article/details/118768164

版权

爬虫实战进阶专栏收录该内容

69 篇文章 254 订阅 ¥39.90 ¥99.00

订阅专栏

假设现在有个爬虫需求，抓取某平台的历史文章标题，对标题的文字进行词频统计分析，并最终生成词云图。

平台如下:

代码如下:

import requests
from lxml import etree
import re
import json
from pyecharts import options as opts
from pyecharts.charts import WordCloud


# 发送请求
def demo(url):
    # 添加请求头
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) \
                Chrome/91.0.4472.124 Safari/537.36'}
    response = requests.get(url, headers=headers).text
    # print(response)
    html = etree.HTML(response)
    return html


# 获取响应，拿取数据
def load

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

写python的鑫哥

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
python爬虫抓取某平台的文章标题，进行词频统计并生成词云

假设现在有个爬虫需求，抓取某平台的历史文章标题，对标题的文字进行词频统计分析，并最终生成词云图。平台如下:代码如下:import requestsfrom lxml import etreeimport reimport jsonfrom pyecharts import options as optsfrom pyecharts.charts import WordCloud# 发送请求def demo(url): # 添加请求头 headers = {
复制链接

扫一扫