1. 什么是数据提取 简单的来说,数据提取就是从响应中获取我们想要的数据的过程 2. 爬虫中数据的分类 结构化数据:json,xml等 - 处理方式:直接转化为python类型 非结构化数据:HTML - 处理方式:正则表达式、xpath 下面以今日头条的首页为例,介绍结构化数据和非结构化数据 结构化数据例子: 非结构化数据: XML数据: <bookstore> <book category&