爬取中国大学排名

看到结果真是伤心~~~~~。

import requests
from bs4 import BeautifulSoup
import bs4

def get_html(url):        #获取网页内容
    try:
        page=requests.get(url,timeout=30)
        page.status_code
        page.encoding=page.apparent_encoding   #让编码统一
        return page.text                       #返回文本形式
    except:
        return 'error'


def get_list(Ulist,html):
    soup=BeautifulSoup(html,'html.parser')        #解析网页
    for tr in soup.find('tbody').children:        #查找tbody所有的子结点
        if isinstance(tr,bs4.element.Tag):        #判断是否是标签类型
            tds=tr('td')                          #将tr里的所有td赋给tds
            Ulist.append([tds[0].string,tds[1].string,tds[2].string,tds[4].string])     #将td标签里的所有内容加到Ulist列表里
def print_list(Ulist,num):

    print("{0:^10}\t{1:{3}^10}\t{2:{5}^10}\t{4:^10}".format('排名','名称','地点',chr(12288),'学生质量',chr(12288)))                                     #.format函数格式输出
    for university in range(num):                       chr(12288)是中文空格的编码,这里使用中英文混排,使得排列整齐
        r=Ulist[university]
        #print("{0:^10}\t{1:{3}^10}\t{2:^10}".format(r[0],r[1],r[2],chr(12288)))


def Compaus_rank_search(Ulist,name):
    print("{0:^10}\t{1:{3}^10}\t{2:{5}^10}\t{4:^10}".format('排名', '名称', '地点', chr(12288), '学生质量', chr(12288))) # .format函数格式输出
    for university in range(600):
        r = Ulist[university]

        if r[1] == name:
            print("{0:^10}\t{1:{3}^10}\t{2:{5}^10}\t{4:^10}".format(r[0], r[1], r[2], chr(12288), r[3], chr(12288)))


def input_compaus_name(Ulist):
    while True:
        name=input("请输入学校名称:")
        Compaus_rank_search(Ulist,name)
Uli=[]
url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'
html=get_html(url)
get_list(Uli,html)
input_compaus_name(Uli)
#print_list(Uli,600)



很惨,好好学技术,我不想被温水煮了。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值