网络爬虫
带你深入浅出掌握爬虫原理,带你玩转requests第三方库以及重量级爬虫框架Scrapy,通俗讲解各平台反爬机制,精通爬虫不是梦。
Pythonicc
专注全栈开发、web逆向工程、践行DevOps理念。
雅思6.0、PMP项目管理专家、CKA(Certified Kubernetes Administrator)。
展开
-
HTTP/HTTPS的请求与响应【python爬虫小课堂】
HTTP和HTTPS HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。 HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加入SSL层。 SSL(Secure Sockets Layer 安全套接层)主要用于Web的安全传输协议,在传输层对网络连接进行加密,保障在Internet上数据传输的安全。 HTTP的端口号为80,.原创 2020-05-23 10:42:42 · 70729 阅读 · 0 评论 -
str与bytes的区别【python爬虫小课堂】
bytes bytes对象只负责以二进制字节序列的形式记录所需记录的对象,至于该对象到底表示什么(比如到底是什么字符)则由相应的编码格式解码所决定 Python2 中 >>> type(b'xxxxx') <type 'str'> >>> type('xxxxx') <type 'str'> Python3 中 >>> type(b'xxxxx') <class 'bytes'> >>> type(原创 2020-05-23 10:38:52 · 65936 阅读 · 0 评论 -
Requests简单使用【python爬虫小课堂】
Requests: 让 HTTP 服务人类 虽然Python的标准库中 urllib 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用:) Requests 继承了urllib的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码原创 2020-05-23 02:48:39 · 66144 阅读 · 0 评论