爬取数据步骤:
1.发生送请求(Request)
1.请求方式:
Get,Post
2.请求URL:
URL全称“统一资源定位符”
如:一个网页版,一张图片。一个视频等
3.请求头
头部信息User-Agent 、Host、Cookies等信息
4.请求体
请求是额外携带的数据
如表单提交是的表单数据
2.获取数据(Response)
1.响应状态:
如: 200 代表成功
301 代表跳转
404 代表找不到页面
502 代表服务器错误
2.响应头
如:内容类型、内容长度、服务器信息、设置Cookie等
3.响应体
最主要的部分,包含了请求资源的内容
如:网页HTML、图片二进制数据等
3.解析数据(Parse)
1.直接处理
2.Json解析