Python_爬虫复习_爬取直播间弹幕生成词云图

本文介绍了如何使用Python进行网络爬虫,抓取2021年5月23日RNG夺冠直播间的弹幕信息。通过安装jieba和wordcloud库,实现数据抓取并生成词云图。详细步骤包括环境准备、数据准备、编写爬虫代码及最终的词云图展示。
摘要由CSDN通过智能技术生成

爬取直播间弹幕,生成词云图

一、环境准备: 安装相关第三方库
pip install jieba
pip install wordcloud
二、数据准备:
爬取对象:2021年5月23号,RNG夺冠直播间的弹幕信息
爬取对象路径:
方式1、根据开发者工具(F12),获取请求url、请求头、cookie等信息;
方式2:根据直播地址url,前+字符i
我们这里演示的是,采用方式2。

三‘、代码如下’

import requests, re
import jieba, wordcloud

"""
# 以下是练习代码
def get_f12_barrage(url, headers, file_path):
    
    #通过f12中的,请求地址,获取弹幕数据
    #:param url:  通过弹幕地址(通过开发者工具,从请求数据中获取的)
    #:param headers:   请求头信息
    #:param file_path:  响应数据存储路径
    #:return:    无返回数据
    
    # 1、发送请求,接受响应数据
    response = requests.get(url=url, headers=headers)
    # 2、获取响应数据
    # 返回的响应可能是乱码的,需要先转成响应的编码格式
    # apparent_encoding的作用:会从网页的内容中分析网页编码的方式
    response.encoding 
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值