2018最好大学排行榜爬虫爬取

最新推荐文章于 2024-07-13 23:51:16 发布

JOKER1911

最新推荐文章于 2024-07-13 23:51:16 发布

阅读量950

点赞数

分类专栏：爬虫文章标签：最好大学排行榜 python 爬虫

本文链接：https://blog.csdn.net/JOKER1911/article/details/80939117

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

需要的库有requests、BeautifulSoup

import requests
from bs4 import BeautifulSoup
import bs4
uinfo = []
ulist = []
try:
    r = requests.get("http://www.zuihaodaxue.com/zuihaodaxuepaiming2018.html",timeout = 30)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
except:
    r.text = ""
demo = r.text
soup = BeautifulSoup(demo,"html.parser")
for tr in soup.find('tbody').children:
     if isinstance(tr,bs4.element.Tag):
         tds = tr('td')
         ulist.append([tds[0].string,tds[1].string,tds[2].string,tds[3].string,tds[4].string])
tplp = "{0:^10}\t{1:{3}^14}\t{2:^4}"
print( "{0:^10}\t{1:{3}^10}\t{2:^10}".format("排名","大学名字","分数",chr(12288)))
for i in range(516):
    u = ulist[i]
    print(tplp.format(u[0],u[1],u[3],chr(12288)))
print("Success")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JOKER1911

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2018最好大学排行榜爬虫爬取

需要的库有requests、BeautifulSoupimport requestsfrom bs4 import BeautifulSoupimport bs4uinfo = []ulist = []try: r = requests.get("http://www.zuihaodaxue.com/zuihaodaxuepaiming2018.html",timeout = 3...
复制链接

扫一扫