-
什么是数据提取
简单的来说,数据提取就是从响应中获取我们想要的数据的过程
-
爬虫中数据的分类
结构化数据:json,xml等
处理方式:直接转化为python类型
非结构化数据:HTML
处理方式:正则表达式、xpath
下面以某网站首页为例,介绍结构化数据和非结构化数据
结构化数据例子:
非结构化数据:
XML数据:
<bookstore>
<book category="COOKING">
<title lang
什么是数据提取
简单的来说,数据提取就是从响应中获取我们想要的数据的过程
爬虫中数据的分类
结构化数据:json,xml等
处理方式:直接转化为python类型
非结构化数据:HTML
处理方式:正则表达式、xpath
下面以某网站首页为例,介绍结构化数据和非结构化数据
结构化数据例子:
非结构化数据:
XML数据:
<bookstore>
<book category="COOKING">
<title lang