推荐教材:
《Python网络程序设计(微课版)》,ISBN:978-7-302-58312-7,董付国,清华大学出版社,2021年8月出版,京东、当当、淘宝均有销售
配套资源:
教学大纲、445页PPT、91个例题源码、60段演示代码、20小时微课视频、223道章节习题+答案。
================
任务描述:
使用Python语言编写网络爬虫程序,采集山东省考试院发布的2024年普通高校招生专业(专业类)选考科目要求,然后统计不同要求的本科专业数量和专科专业数量。
网页源代码分析与爬虫程序原理请参考:
赋分规则与计算方法请参考:
爬虫程序代码,需要安装扩展库openpyxl:
采集到的数据保存至Excel文件中,内容格式如下(可以后台发送消息“20220102”下载Excel文件):
这样的数据分析相对来说比较简单,一般就是是查询不同高校和专业对选考科目的要求,主要使用数据筛选和过滤技术,下面的代码统计了不同选考科目要求的专业数量,大家可以参考思路自由发挥和改写代码。
运行结果:
温馨提示:
关注微信公众号“Python小屋”,在公众号后台发送消息“大事记”可以查看董付国老师与Python有关的重要事件;发送消息“教材”可以查看董付国老师出版的Python系列教材(已累计印刷超过140次)的适用专业详情;发送消息“历史文章”可以查看董付国老师推送的超过1000篇原创技术文章;发送消息“会议”或“培训”可以查看近期董付国老师的培训安排;发送消息“微课”可以查看董付国老师免费分享的超过600节Python微课视频;发送消息“课件”可以查看董付国老师免费分享的Python教学资源;发送消息“小屋刷题”可以下载“Python小屋刷题神器”,免费练习2066道客观题和425道编程题,题库持续更新;发送消息“编程比赛”了解Python小屋编程大赛详情。