分析 需求:模拟正常浏览爬取极客学院知识体系图信息,并以EXCEL形式存储。 思路: 分析页面结构,找出有用信息特征结构 在spider中进行页面解析,以字典形式存储,返回item pipiline解析item信息,并以excel工作表形式存储到本地 进行相关配置 页面分析 矩形: 页面 圆角矩形: 页面组成 link link link contain contain contain contain contain contain link contain contain contain 知识体系图页面结构及深度 体系图列表页面 HTML5体系图页面 ...... XX体系图页面 学习阶段1 ...... 学习阶段12 课程1 ...... 课程6 课程页面