python爬虫世界最好大学_Python编程语言:使用网络爬虫获取大学排名

上一篇文章,和大家分享的是如何获取信息标记的知识,这篇文章,小编要和大家分享的是使用Python网络爬虫技术来获取大学排名!

当我们想要了解大学排名时,如何在杂乱的网页信息上,快速获取我们想要的大学排名信息了!

这里就需要用到Python网络爬虫提取信息的技术了!

大学排名的程序代码如下:

u=500733347,508113924&fm=173&app=49&f=JPEG?w=640&h=427&s=CFB327C14443274D0698C89403005090清华大学

#CrawUnivRankingB.py

import requests

from bs4 import BeautifulSoup import bs4

def getHTMLText(url):

try:

r = requests.get(url, timeout=30)

r.raise_for_status()

r.encoding = r.apparent_encoding

return r.text

except: return "" def fillUnivList(ulist, html):

soup = BeautifulSoup(html, "html.parser")

for tr in soup.find('tbody').children:

if isinstance(tr, bs4.element.Tag):

tds = tr('td')

ulist.append([tds[0].string, tds[1].string, tds[3].string])

def printUnivList(ulist, num): tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"

print(tplt.format("排名","学校名称","总分",chr(12288)))

for i in range(num): u=ulist[i] print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main(): uinfo = []

url = 'https://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'

html = getHTMLText(url)

fillUnivList(uinfo, html)

printUnivList(uinfo, 20) # 20 univs main()

u=1904295834,1158596653&fm=173&app=49&f=JPEG?w=640&h=480&s=CA110DC0972E2AAE1AC8F103030070C0北京大学

通过运行这段程序代码,小编得到的结果是清华大学排第一!

运用好网络爬虫方便我们快速了解信息!

u=1803932779,2460969079&fm=173&app=49&f=JPEG?w=552&h=320&s=65F2AA624BA19AD846D4291E010080C1爬虫技术

今天小编知识分享就到这里,就结束了!明天同一时间为大家分享更精彩的知识!请大家多多点赞支持,多多关注和收藏,同时祝大家新年快乐!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值