Python——爬虫(2)

要使用Python爬取B站热门视频,可以使用第三方库requests和BeautifulSoup来实现。

首先,你需要安装这两个库。你可以使用以下命令在终端或命令提示符中安装它们:

pip install requests beautifulsoup4

接下来,你可以使用以下代码来爬取B站的热门视频:

import requests
from bs4 import BeautifulSoup

url = 'https://www.bilibili.com/v/popular/rank/all'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')

videos = soup.find_all('li', class_='rank-item')

for video in videos:
    title = video.find('a', class_='title').text.strip()
    author = video.find('a', class_='name').text.strip()
    play = video.find('span', class_='data-box').find('span').text.strip()

    print('标题:', title)
    print('作者:', author)
    print('播放量:', play)
    print('---')

这段代码首先使用requests库发送HTTP GET请求,然后使用BeautifulSoup解析HTML内容。我们使用BeautifulSoup的find_all方法找到所有热门视频的li元素。然后,我们从每个li元素中提取视频的标题、作者和播放量,并打印出来。

请注意,为了避免被B站服务器拒绝访问,我们添加了一个User-Agent标头,模拟一个正常的浏览器。

注意:此代码仅适用于B站的网页结构。如果B站的网页结构发生变化,可能需要进行相应的修改。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值