python 按省份输出中国大学排名

最新推荐文章于 2022-09-20 14:16:15 发布

sdu@xy

最新推荐文章于 2022-09-20 14:16:15 发布

阅读量4.5k

点赞数 3

分类专栏： python

本文链接：https://blog.csdn.net/qq_44787993/article/details/106795078

版权

python 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

import requests
from bs4 import BeautifulSoup
import bs4
 
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""
 
def fillUnivList(ulist, html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr, bs4.element.Tag):
            tds = tr('td')
            if not ulist.get(tds[2].string):
                ulist[tds[2].string]=[]
            ulist[tds[2].string].append([tds[0].string, tds[1].string ,tds[3].string])
            
def printUnivList(per_provinve_list, num):
    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
    print(tplt.format("排名","学校名称","总分",chr(12288)))
    if len(per_provinve_list)<num:
        num=len(per_provinve_list)
    for i in range(num):
        u=per_provinve_list[i]
        print(tplt.format(u[0],u[1],u[2],chr(12288)))
        
def printAllProvince(ulist,num):
    for key in ulist.keys():
        print("-------------------{}---------------------".format(key))
        per_provinve_list=ulist[key]
        printUnivList(per_provinve_list,num)
        print("")

     
def main():
    uinfo = {}
    url = 'http://www.zuihaodaxue.com/zuihaodaxuepaiming2020.html'
    html = getHTMLText(url)
    fillUnivList(uinfo, html)
    printAllProvince(uinfo, 5)
main()

部分输出：

sdu@xy

关注

3
点赞
踩
24

收藏

觉得还不错? 一键收藏
2
评论
python 按省份输出中国大学排名

import requestsfrom bs4 import BeautifulSoupimport bs4 def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" .
复制链接

扫一扫