聚焦爬虫
流程:
- 指定url
- 发起请求
- 获取响应数据
- 数据解析
- 持久化存储
数据解析
- 正则表达式
- bs4
- xpath (重点)
解析原理分析:
- 解析的局部的文本内容都会在标签之间或者标签对应的属性中进行储存
- 1.进行指定标签的定位
- 2。标签或者标签对应属性中存取的数据值进行提取(解析)
聚焦爬虫
流程:
数据解析
解析原理分析:
- 解析的局部的文本内容都会在标签之间或者标签对应的属性中进行储存
- 1.进行指定标签的定位
- 2。标签或者标签对应属性中存取的数据值进行提取(解析)