Python网络爬虫：b站评论

wp_tao

已于 2024-05-16 22:22:47 修改

阅读量746

点赞数 7

分类专栏： Python爬虫文章标签：爬虫

于 2024-04-04 14:35:20 首次发布

本文链接：https://blog.csdn.net/lyccomcn/article/details/137374559

版权

Python爬虫专栏收录该内容

30 篇文章 1 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

首先来看一下采集的数据格式：

本文不对数据采集的过程做探讨，直接上代码。首先要在程序入口处bvids列表内替换成自己想要采集的视频bvid号，然后将self.cookies替换成自己的（需要字典格式），代码可以同时爬取多个视频的评论，且爬取的评论较为完整，亲测有效：

import csv
import math
import re
import requests
import time
import json


class BilibiliComment:
    def __init__(self):
        """
        需要替换cookies，字典格式
        """
        self.cookies = {
            
        }   
        self.headers = {
            'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',

了解本专栏