目录
1、“中国大学排名定向爬虫”实例介绍
(1)最好大学网
http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html。
(2)功能描述
输入:大学排名URL链接。
输出:大学排名信息的屏幕输出(排名,大学名称,总分)。
技术路线:requests-bs4。
定向爬虫:仅对输入URL进行爬取,不扩展爬取。
(3)程序的结构设计
步骤1:从网络上获取大学排名网页内容:getHTMLText()。
步骤2:提取网页内容中信息到合适的数据结构:fillUnivList()。
步骤3:利用数据结构展示并输出结果:printUnivList()。