大数据Python爬取B站电影排行榜——爬取信息

最新推荐文章于 2022-05-21 09:06:38 发布

VIP文章 JJU~

最新推荐文章于 2022-05-21 09:06:38 发布

阅读量2.9k

点赞数 7

分类专栏：大数据Python 文章标签： python

本文链接：https://blog.csdn.net/weixin_51509194/article/details/118306129

版权

大数据Python爬取B站电影排行榜—信息爬取

前言
一、配置环境
二、爬取B站电影排行榜top100
- 1.找到B站电影排行榜top100网页
- 2.用URL进行爬取信息
三、建立Excel表并导出
总结

前言

通过学习《大数据基本开发与实验》课程，完成对B站电影排行榜的爬取，并进行数据预处理和可视化分析。

一、配置环境

该项目需要配置Python3.0环境，我采用的是jupyter里面的Python3，其实是一样的。

二、爬取B站电影排行榜top100

1.找到B站电影排行榜top100网页

找到B站电影排行榜top100的页面，对该页面的源代码进行分析。（点击右键，即可查看源代码），或者找到属性，找到网络network，查看URL=“…”。

2.用URL进行爬取信息

请求头、包代码如下（示例）：

import os
import requests
import xlwt
from lxml import html
import pandas as pd

使用的url网络请求的数据代码如下（示例）：

def bug(key_once):
    url = 'https://www.bilibili.com/v/popular/rank/movie'
    #获得一个网页最简单直接的方法就是  r = requests.get(url)  ，向服务器请求资源。
    response = requests.get

最低0.47元/天解锁文章

JJU~

关注

7
点赞
踩
44

收藏

觉得还不错? 一键收藏
8
评论
大数据Python爬取B站电影排行榜——爬取信息

大数据Python爬取B站电影排行榜前言一、配置环境二、爬取B站电影排行榜top1001.找到B站电影排行榜top100网页2.用URL进行爬取信息三、建立Excel表并导出总结前言通过学习《大数据基本开发与实验》课程，完成对B站电影排行榜的爬取，并进行数据预处理和可视化分析。一、配置环境该项目需要配置Python3.0环境，我采用的是二、爬取B站电影排行榜top1001.找到B站电影排行榜top100网页找到B站电影排行榜top100的页面，对该页面的源代码进行分析。（点击右键，即可查看源
复制链接

扫一扫