python爬虫（爬取弹幕）

最新推荐文章于 2023-05-08 15:06:36 发布

置顶

东极之边~云

最新推荐文章于 2023-05-08 15:06:36 发布

阅读量6.1k

点赞数 1

文章标签： Python爬虫（爬取弹幕）

本文链接：https://blog.csdn.net/weixin_42965311/article/details/82667984

版权

本文介绍了如何使用Python进行网页爬虫，提取弹幕信息。首先导入正则表达式和request模块，然后请求弹幕所在页面，通过headers伪装请求。接着使用正则匹配HTML获取弹幕数据，并保存到TXT文件。最后，利用wordcloud模块生成词云，展示弹幕内容的可视化效果。

摘要由CSDN通过智能技术生成

一、首先导入需要的模块

import re
import requests

首先导入这两个模块，一个是正则需要的模块，因为之后需要用正则来匹配，之后导入 request 模块，爬取数据需要的模块。

二、页面请求，提取数据

url='https://api.bilibili.com/x/v1/dm/list.so?oid=54160178'
headers={
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}

response=requests.get(url=url,headers=headers,verify=False)
content=response.content.decode('utf-8')

先在页面中，找到弹幕所在位置，将 url 找出来，然后写 headers,用来爬取数据&

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

东极之边~云

关注关注

1
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
python爬虫（爬取弹幕）

一、首先导入需要的模块import reimport requests首先导入这两个模块，一个是正则需要的模块，因为之后需要用正则来匹配，之后导入 request 模块，爬取数据需要的模块。二、页面请求，提取数据url='https://api.bilibili.com/x/v1/dm/list.so?oid=54160178'headers={'User-Agent'...
复制链接

扫一扫