-
聚焦爬虫:爬取指定的页面内容
-
编码流程
-
指定url
-
发起请求
-
获取响应数据
-
数据解析
-
持久化存储
-
-
-
数据解析分类:
-
正则
-
bs4
-
xpath(***)
-
-
数据解析原理概述
---------解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储
-
进行指定的标签定位
-
标签或者标签对应的属性中存储的数据值进行提取(解析)
-
爬取图片
聚焦爬虫:爬取指定的页面内容
编码流程
指定url
发起请求
获取响应数据
数据解析
持久化存储
数据解析分类:
正则
bs4
xpath(***)
数据解析原理概述
---------解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储
进行指定的标签定位
标签或者标签对应的属性中存储的数据值进行提取(解析)
爬取图片