1、聚焦爬虫:爬取页面中指定的页面内容
编码流程:
(1)指定url
(2)发起请求
(3)获取响应数据
(4)数据解析
(5)持久化存储数据
2、数据解析分类:
(1)正则表达式
(2)bs4解析
(3)xpath解析
3、数据解析
解析的局部文本内容都会在标签之间或者标签对应的属性中进行存储
(1)进行指定标签的定位
(2)标签或者标签对应的属性中存储的数据进行提取(解析)
1、聚焦爬虫:爬取页面中指定的页面内容
编码流程:
(1)指定url
(2)发起请求
(3)获取响应数据
(4)数据解析
(5)持久化存储数据
2、数据解析分类:
(1)正则表达式
(2)bs4解析
(3)xpath解析
3、数据解析
解析的局部文本内容都会在标签之间或者标签对应的属性中进行存储
(1)进行指定标签的定位
(2)标签或者标签对应的属性中存储的数据进行提取(解析)