问题:获取中国大学MOOC平台的课程信息,包括开课学校、课程类别(标签)、课程名称、课程评分、评价人数和已参加课程人数。
思路:
1.进入中国大学MOOC首页,点击“学校”,进入学校页面(可直接获取单个url)
2.获取页面上所有学校url,保存到列表中(当前页上有所有学校url)
3.依次进入学校页面,获取所有课程的url(不止一页,需要翻页操作)
高亮:这一步要注意有的学校页面下没有课程没有课程没有课程,有的学校下只有一页课程!
4.进入课程页面,获取信息,存入列表
需要注意的就是几处点击操作,以及准确找到和提取目标文本
import requ