python爬虫
.
久而安之
这个作者很懒,什么都没留下…
展开
-
requests库
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 “HTTP for Humans”,说明使用更简洁方便。安装和文档地址:利用pip可以非常方便的安装:pip install requests中文文档:http://docs.python-requests.org/zh_CN/latest/index.htmlgithub地址:https://github.com/re...转载 2020-08-10 09:49:20 · 158 阅读 · 0 评论 -
urllib库
urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。urlopen函数:在Python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面了,以先来看下urlopen函数基本的使用:from urllib import requestresp = request.urlopen('http://www.baidu.com')print(resp.read...转载 2020-08-06 17:53:16 · 251 阅读 · 0 评论 -
http协议和Chrome抓包工具
http协议和Chrome抓包工具什么是http和https协议:HTTP协议:全称是HyperText Transfer Protocol,中文意思是超文本传输协议,是一种发布和接收HTML页面的方法。服务器端口号是80端口。 HTTPS协议:是HTTP协议的加密版本,在HTTP下加入了SSL层。服务器端口号是443端口。在浏览器中发送一个http请求的过程:当用户在浏览器的地址栏中输入一个URL并按回车键之后,浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为“Get”和...转载 2020-08-06 11:04:29 · 306 阅读 · 0 评论