Python学习之爬虫(一)--获取论坛中学生获得offer信息
程序:爬取2017-2019期间学生获得offer信息
目的:爬取帖子中每个学生的offer信息,并保存在Excel文档中
过程
1. 爬取每个帖子中学生offer信息
1.1 查看HTML,找到论坛中所有帖子的链接
1.2 遍历链接,爬取每个帖子中个人信息以及offer信息
由于帖子中无姓名等标识个人身份的数据,因此用发帖人id号(唯一)来标识它的个人信息和offer信息。存放在数组第一列
...
原创
2019-10-10 17:28:31 ·
438 阅读 ·
0 评论