定向爬虫：中国大学排名定向爬虫（一）

最新推荐文章于 2024-04-23 00:20:20 发布

liuxiang1995

最新推荐文章于 2024-04-23 00:20:20 发布

阅读量1.8k

点赞数

分类专栏： python 文章标签：爬虫 python

本文链接：https://blog.csdn.net/liuxiang1995/article/details/78545831

版权

中国大学排名定向爬虫（一）

话不多说，直接放码

代码很粗糙，还没有优化，而且有一个很有意思的问题没有解决，http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html和http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html页面完全一模一样，代码同样可以运行，但是在处理2017排名时，写入的第一列数据排名全部为None，很奇怪，还没解决，未完待续。

            # -*- coding: utf-8 -*-
            """
            Created on Wed Nov 15 20:59:32 2017

            @author: 刘翔
            中国大学排行榜定向爬虫编写，以“最好大学网”为爬取目标，使用BeautifulSoup库
            """
            import requests
            from bs4 import BeautifulSoup
            import bs4 

            def getHTMLText(url):
                try:
                    r = requests.get(url,timeout = 30)

最低0.47元/天解锁文章

liuxiang1995

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
定向爬虫：中国大学排名定向爬虫（一）

中国大学排名定向爬虫（一）话不多说，直接放码代码很粗糙，还没有优化，而且有一个很有意思的问题没有解决，http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html和http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html页面完全一模一样，代码同样可以运行，但是在处理2017排名时，写入的第一列数据排名全部
复制链接

扫一扫