Python抓取哔哩哔哩up主信息:只要爬虫学的好,牢饭吃的早

该项目旨在爬取哔哩哔哩UP主信息及投稿视频,用于数据分析学习。采用反反爬策略,支持数据库存储,并提供详细的使用说明。用户需注意合法合规使用,避免侵犯他人权益。
摘要由CSDN通过智能技术生成

本项目主要功能是爬取部分哔哩哔哩up主信息和up主投稿视频信息,用作数据处理与分析学习(不得用于商业和其他侵犯他人权益的用途)。有此需求的朋友可以了解下本项目

项目地址:

https://github.com/cgDeepLearn/BilibiliCrawler

项目特点:

  • 采取了一定的反反爬策略。

  • Bilibili更改了用户页面的api, 用户抓取解析程序需要重构。

在这里插入图片描述

快速开始:

  • 拉取项目, git clone https://github.com/cgDeepLearn/BilibiliCrawler.git

  • 进入项目主目录,安装虚拟环境crawlenv(请参考使用说明里的虚拟环境安装)。

  • 激活环境并在主目录运行crawl,爬取结果将保存在data目录csv文件中。

ource activate crawlenv
python initial.py file  # 初始化file模式
python crawl_user.py file 1 100  # file模式,1 100是开始、结束bilibili的uid

进入data目录查看抓取的数据,是不是很简单!

如果需要使用数据库保存和一些其他的设置,请看下面的使用说明

使用说明:

1.拉取项目

git clone https://github.com/cgDeepLearn/BilibiliCrawler.git

2.进入项目主目录, 安装虚拟环境

  • 若已安装anaconda
conda create -n crawlenv python=3.6
source activate crawlenv  # 激活虚拟环境
pip install -r requirements.txt
  • 若使用virtualenv
  • </
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>