Python爬虫入门<二>—模拟浏览器

最新推荐文章于 2024-05-04 13:59:48 发布

后台服务器开发

最新推荐文章于 2024-05-04 13:59:48 发布

阅读量959

点赞数

分类专栏： Python Python成长之路文章标签： python 爬虫爬虫-python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Travelerwz/article/details/79771485

版权

Python 同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

Python成长之路

18 篇文章 1 订阅

订阅专栏

模拟浏览器

标签： python爬虫模拟浏览器

1.为什么要模拟浏览器

其实，我们访问一一些需要登录的网站的时候，我们的到的请求是由浏览器发出来的，所以我们做爬虫的时候，需要模拟浏览器的环境，从而的到响应。

2需要的工具

其实，在做爬虫的时候，我们需要工具去进行抓包，这里我用的谷歌浏览器自带的抓包工具，大家也可以用fidder,当然还有很多人喜欢用火狐（据说好用）
我就用谷歌浏览器了（嘻嘻）
那我们就用豆瓣来模拟（都喜欢用豆瓣）
此处输入图片的描述

3编写代码访问

import urllib.request

def savefile(data):
    path = "C:\\Users\\Administrator\\Desktop\\爬虫豆瓣.txt"
    f = open(path ,'wb+')
    f.write(data)
    f.close()

url = "https://www.douban.com/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(url)
data = response.read()
savefile(data)

此处输入图片的描述

HTTP文件详解

后台服务器开发

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫入门<二>—模拟浏览器

模拟浏览器
复制链接

扫一扫

专栏目录

后台服务器开发 CSDN认证博客专家 CSDN认证企业博客

码龄8年

231: 原创

3万+: 周排名

112万+: 总排名

23万+: 访问

: 等级

4611: 积分

129: 粉丝

166: 获赞

48: 评论

676: 收藏

私信

关注

热门文章

分类专栏

数据库 1篇
redis 11篇
linux网络编程 44篇
boost 7篇
傻瓜式学JAVA 1篇
JAVA开发
zeromq 4篇
Python成长之路 18篇
shell脚本编程 8篇
C++设计模式 1篇
Linux 40篇
C\C++ 70篇
数据结构 17篇
STL 2篇
Unix网络编程 43篇
项目 1篇
面试题 27篇
算法 5篇
github 3篇
笔试题 7篇
mysql 3篇
Python 27篇
后台开发 29篇
libevent 8篇
设计模式 3篇
剑指offer 2篇
爬虫 1篇
selenium 1篇
模板模式 1篇
time_wait 1篇

最新评论

AVL树平衡因子详解
kevin__cai__: 引用「左」 16的平衡因子，左右子树有问题
AVL树平衡因子详解
c1374357928: 差点被误导了，虽然不影响，但是万一考出来呢
TCP回射服务器
杨露深深: 请问下回射是什么意思呢？感觉就是普通的客户端和服务器编程呀
Python爬虫之gif图片抓取
qq_57049848: 已解决，得到了启发，用scrapy爬取的格式虽然是gif但是实际还是jpeg，静态图
redis分布式锁？坑那么多
winrh: setnx和expire用lua脚本一起执行，也可以避免锁死

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。