python爬虫之如何随机更换User-Agent

最新推荐文章于 2025-03-13 15:59:12 发布

Ta来自江湖

最新推荐文章于 2025-03-13 15:59:12 发布

阅读量1.3w

点赞数 10

分类专栏： Web Crawler 文章标签： python 爬虫 user-agent 随机user-agent fake-useragent

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/codingforhaifeng/article/details/80506199

版权

python爬虫爬取网站内容时，如果什么也没带，即不带报头headers，往往会被网站管理维护人员认定为机器爬虫。因为，此时python默认的user-agent如Python-urllib/2.1一样。因此，网站管理人员会根据请求的user-agent判定你是不是机器爬虫。所以，此时往往就需要伪装user-agent，模拟成真实的浏览器去取出内容。下面是一些比较常用的浏览器的user-agent：

Chrome

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1",
"Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",
"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",
"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",
"M

最低0.47元/天解锁文章

博客等级

码龄7年

31
原创

70
点赞

197
收藏

24
粉丝

关注

私信

分类专栏

python 16篇
HTTP 1篇
Web Crawler 8篇
HTML 2篇
Linux 1篇
Software 1篇
MySQL 2篇
Network 1篇
Machine learning 4篇

最新评论

python爬虫之如何随机更换User-Agent
虫本初阳: 谢谢分享！想请教下，“注意，有些网站可能会根据user-agent来封IP，也就是说他们会根据同一个IP下，如果是很多个不同user-agent在访问，那么，此时，他们就会判定为爬虫！”这句话中的ip指的是谁的ip呢？是自己微博的ip吗，可是程序在编写的时候好像没有写自己微博的ip呀？又或者是自己主机的ip 求赐教
Git-2.17版本Windows环境系统下安装教程
林子a、: 很细致，很棒
百度新闻评论内容抓取
Hom的电子厨房: 大佬，GitHub怎么没了？
百度新闻评论内容抓取
Tisfy: 总结得十分精辟，就像那：灯火纸窗修竹里，读书声。
UC头条（大鱼）文章评论内容抓取
Tisfy: 总结得十分精辟，就像那：铁马云雕久绝尘，柳营高压汉营春。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。