Scrapy框架抓取四川大学公共管理学院教师信息
目录
项目要求
准备步骤
代码编写
结果分析
问题解析
相关链接
一,项目要求
明确目标网址和items:我们要抓取的是四川大学公共管理学院教师主页128位教师信息,包括的item有name(x姓名),title(职称),dep(所属部系),email(邮件),img(图片)以及详情页面的decs(个人简介)
明确分页处理的方法
明确怎么获取详情页信息
会使用xpath来编写数据路径
二 , 准备步
原创
2017-05-13 15:13:58 ·
1028 阅读 ·
0 评论