京东图片爬取（requests+lxml 最简单的方式)

最新推荐文章于 2024-05-15 16:47:05 发布

T_maker

最新推荐文章于 2024-05-15 16:47:05 发布

阅读量2.2k

点赞数 2

分类专栏：爬虫爱好者爬虫新手文章标签： python 爬虫入门代码京东图片反爬

本文链接：https://blog.csdn.net/T_maker/article/details/79146902

版权

最容易让新手看懂上手的语言python，最强大的爬虫模块requests+最便捷的节点提取方式xpath

from retrying import retry
from lxml import etree
import requests
import re
import os


class Spider(object):
    def __init__(self):
        self.headers = {
            '''模拟浏览器，防反爬，同理可以加上refer与cookie'''
            "User_Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"
        }

    '''尝试五次'''
    @retry(stop_max_attempt_number=5)
    def _parse_url(self, url):
        try:
            response = requests.get(url, headers=self.headers).content.decode()

        except:
            return ""
        else:

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

T_maker

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
京东图片爬取（requests+lxml 最简单的方式)

最容易让新手看懂上手的语言python，最强大的爬虫模块requests+最便捷的节点提取方式xpathfrom retrying import retryfrom lxml import etreeimport requestsimport reimport osclass Spider(object): def __init__(self): se
复制链接

扫一扫