python不用正则表达式！爬取豆瓣网 TOP250 电影图片

最新推荐文章于 2024-05-13 15:07:13 发布

xyislove

最新推荐文章于 2024-05-13 15:07:13 发布

阅读量519

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/u012801679/article/details/111317163

版权

前言：研究爬虫2个月，查看了许多方法，无一不涉及正则表达式，导致初学者往往一头雾水，现将全程利用字符串find函数查找匹配爬取豆瓣网 TOP250 电影图片的方法敬上，欢迎交流学习。 ----xyisloveimport urllib.requestimport os# 不用正则表达式爬取豆瓣网 TO...

摘要由CSDN通过智能技术生成

前言：
研究爬虫2个月，查看了许多方法，无一不涉及正则表达式，导致初学者往往
一头雾水，现将全程利用字符串find函数查找匹配爬取豆瓣网 TOP250 电影图片
的方法敬上，欢迎交流学习。
----xyislove

import urllib.request
import os
# 不用正则表达式爬取豆瓣网 TOP250 电影图片
# https://movie.douban.com/top250?start=0&filter=
# top250?start=0&filter= 存在规律的地方等差差为25 定义i变量迭代或循环实现
# <img width="100" alt="肖申克的救赎" src="https://img2.doubanio.com/view/photo/s_ratio_poster/public/p480747492.jpg" class="">
# 此为图片链接 src=" xxxxxxxxxxxxx .jpg 首尾可以查找的线索

#封装请求函数
def url_open(url):
head={}
#根据自己的主机定义 User-Agent参数伪装浏览器
head['User-Agent']='xxxxxxxxxxxxxxxxxxx'
req=urllib.request.Request(url,headers=head)
response&#

最低0.47元/天解锁文章

xyislove

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
python不用正则表达式！爬取豆瓣网 TOP250 电影图片

前言：研究爬虫2个月，查看了许多方法，无一不涉及正则表达式，导致初学者往往一头雾水，现将全程利用字符串find函数查找匹配爬取豆瓣网 TOP250 电影图片的方法敬上，欢迎交流学习。 ----xyisloveimport urllib.requestimport os# 不用正则表达式爬取豆瓣网 TO...
复制链接

扫一扫