Python爬取pilipili排行榜

1. Python爬取pilipili排行榜

  1. 安装requests和beautifulsoup4
  2. 创建一个python文件引入库文件
  3. 利用requests的方法拿到html文档
  4. 通过bs4对html文档进行解析
  5. 将解析的结果写入到一个文件中

1.1 安装requests和beautifulsoup4

1.1.1 使用pycharm安装requests

在这里插入图片描述

1.1.2 安装beautifulsoup4

同样使用pycharm安装beautifulsoup

在这里插入图片描述

1.2 创建一个python文件引入库文件

将requests、Beautifulsoup引入,使用==request.get()==方法获取文旦,利用Beautifulsoup进行解析

import requests
from bs4 import BeautifulSoup

url = "https://www.bilibili.com/v/popular/rank/all"
page = requests.get(url)
soup = BeautifulSoup(page.content, "html.parser")

1.3 爬取数据并写入到文本文档中

import requests
from bs4 import BeautifulSoup

url = "https://www.bilibili.com/v/popular/rank/all"
page = requests.get(url)

soup = BeautifulSoup(page.content, "html.parser")

title = soup.title.text

all_products = []

products = soup.select("li.rank-item")

for product in products:
    rank = product.select("div.num")[0].text
    name = product.select("div.info > a")[0].text.strip()
    play = product.select("span.data-box")[0].text.strip()
    comment = product.select("span.data-box")[1].text.strip()
    up = product.select("span.data-box")[2].text.strip()
    url = product.select("div.info > a")[0].attrs['href'].strip()

    all_products.append(
        {
            "视频排名": rank,
            "视频名称": name,
            "播放量": play,
            "弹幕量": comment,
            "up主": up,
            "视频链接": url
        }
    )

with open("bili.txt", "w+", encoding="utf-8-sig") as f:
    for i in range(0, len(all_products)):
        for k, v in all_products[i].items():
            f.write("{},{}\n".format(k, v))
        f.write("--------------------------\n")

1.4 运行结果

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值