爬虫
Blijiojiodibuliduo
学习笔记
展开
-
Requests使用
Requests: 让 HTTP 服务人类相比urllib Requests 自称 “HTTP for Humans”,使用更简洁方便。Requests 继承了urllib的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码。requests 的底层实现其实就是 u...原创 2019-09-20 17:34:59 · 114 阅读 · 0 评论 -
数据提取--JSON
基础知识数据提取什么是数据提取简单来说,数据提取就是从响应中获取我们需要的数据的过程数据分类结构化数据处理方式文本、电话号码、邮箱地址:正则表达html:正则表达式、XPath非结构化数据JSON 文件:JSON Path、转化成Python类型进行操作(json类)XML 文件:转化成Python类型(xmltodict)、XPath、CSS选择器、正则表...原创 2019-09-29 20:46:50 · 290 阅读 · 0 评论