爬取猫眼TOP100源码分享，简单易学，请收藏！！！！！1

PythonYL学习进阶

于 2021-10-15 17:58:16 发布

阅读量962

点赞数 1

分类专栏： Python 成功之路文章标签： python 爬虫代理模式经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57712785/article/details/120788055

版权

本文利用requests及正则表达式完成，以文档形式保存，适合练习，成长的路上我们共同加油！！！
如网页访问报错，或者无内容，网站反爬限制，请更换代理或者更换网络IP，进行测试。（关注后，上篇文档有代理分享）

# 1、抓取单页内容
# 利用requests 请求目标站点，得到单个网页的HTML代码，
# 2.正则表达式分析
# 利用HTML代码分析得到电影的名称。主演，上映时间。评分，图片连接。
# 3.保存到文件。
# 通过文件的形式将结果保存，每一步电影结果json字符

############
import json
import requests
import re
import urllib3
import json
urllib3.disable_warnings()
from requests.exceptions import RequestException # 导入异常处理库
headers = {
    'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3'
}
def get_one_page(url): # 定义一个函数，获取一页的内容
    try:
        response = requests

最低0.47元/天解锁文章

PythonYL学习进阶

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬取猫眼TOP100源码分享，简单易学，请收藏！！！！！1

本文利用requests及正则表达式完成，以文档形式保存，适合练习，成长的路上我们共同加油！！！如网页访问报错，或者无内容，网站反爬限制，请更换代理或者更换网络IP，进行测试。（关注后，上篇文档有代理分享）# 1、抓取单页内容# 利用requests 请求目标站点，得到单个网页的HTML代码，# 2.正则表达式分析# 利用HTML代码分析得到电影的名称。主演，上映时间。评分，图片连接。# 3.保存到文件。# 通过文件的形式将结果保存，每一步电影结果json字符############im
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

PythonYL学习进阶 朋友，一起学习，请多多支持！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。