python爬虫爬取猫眼top100

最新推荐文章于 2024-02-16 14:05:58 发布

Tina_053

最新推荐文章于 2024-02-16 14:05:58 发布

阅读量393

点赞数

分类专栏： Python_爬虫初级

本文链接：https://blog.csdn.net/weixin_42983055/article/details/84678460

版权

本文主要是应用requests+ re 获取猫眼top100 电影的名称，评分，上映时间…等信息。

解析网站：每页显示10个，向下翻页在url后面添加offset=10的倍数
要获取的内容均在<dd 标签里面。
在这里插入图片描述

另外，代码中的headers信息可以自行填写，可通过以下方式找到哦:
在这里插入图片描述
好了，下面就直接正文代码了，希望对向我这样的初学者有帮助！

import requests
from requests.exceptions import RequestException
import re
from multiprocessing import Pool  # 多线程运行
import json
# import os


def get_one_page(url):
    try:
        headers = {'User-Agent&

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Tina_053

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫爬取猫眼top100

import requestsfrom requests.exceptions import RequestExceptionimport redef get_one_page(url): try: headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537....
复制链接

扫一扫