python爬虫之BeautifulSoup4数据提取案例
本文采用bs4爬取bilibili全站排行榜,并打印成excel表格
f12查看页面布局
编码
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2020/4/16 0016 20:46
# @Site : blibili全站榜
# @Author : Yuk
# @File : bilibili_bs4.py
import bs4
import requests
import openpyxl
# 搜索条件
recent = 1 # 近期投稿
whole = 0 # 全部投稿
day = 1 # 日排行
three_day = 3 # 三日排行
weekend = 7 # 周排行
month = 30 # 月排行
# 获取链接
def get_url(type='all', tg=0, day=3, base_url='https://www.bilibili.com/ranking/'):
"""
:param type: 榜单类型:默认all(全站榜)
:param tg: 投稿:默认0(0全部投稿 1近期投稿)
:param day: 日期:默认3(三日排行)
:param base_url: 基础路径
:return: 拼接后url
"""
return base_url + type + '/0'