爬虫IP代理

最新推荐文章于 2024-05-27 08:52:59 发布

pipixia233333

最新推荐文章于 2024-05-27 08:52:59 发布

阅读量1.6k

点赞数

分类专栏： web python开发

本文链接：https://blog.csdn.net/qq_41071646/article/details/89112397

版权

web python开发专栏收录该内容

15 篇文章 0 订阅

订阅专栏

写这篇文章的时候内心还是比较焦灼的 re 看的头疼只能看看python 来维持一下生活然后在网上找了一些视频看有了一些心得就写下来 emmm

    #创建请求对象
    request = urllib.request.Request(url)
    #动态的去添加head的信息
    request.add_header("User-Agent","Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36")

然后关于 urllib 的库也没有什么好解释的好久没有玩过python 爬虫了都有一些不熟悉了

不过今天get 到了一个新的知识就是关于代理ip

大家都知道其实关于爬虫也是有对抗的有些数据人家并不想让你爬如果发现你的ip 响应的频繁就会把你的ip 限制甚至直接封掉那么我们可以用代理ip 设置多种ip 随机用 ip代理然去取爬虫来达到我们的反反爬虫

 for proxy in proxy_list:
        print(proxy)
        #利用遍历出来的ip创建处理器
        proxy_handler = urllib.request.ProxyHandler(proxy)
        #创建opener
        opener = urllib.request.build_opener(proxy_handler)
        #拿着代理ip去发送请求
        response = opener.open(url)
        data = response.read().decode("utf-8")

这样就能够代理ip 然后就能完成我们想要的目标

其它关于什么基础的啊概念我也懒得说了都太基础了

只是感觉这个思路比较新奇如果多线程+ip代理

估计真的能够实现大的方向

但是线程处理先不说也没有很多的ip 能够让我们使用。。。

pipixia233333

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫IP代理

写这篇文章的时候内心还是比较焦灼的 re 看的头疼只能看看python 来维持一下生活然后在网上找了一些视频看有了一些心得就写下来 emmm #创建请求对象 request = urllib.request.Request(url) #动态的去添加head的信息 request.add_header("User-Agent","Mozi...
复制链接

扫一扫