python爬虫世界最好大学_Python编程语言：使用网络爬虫获取大学排名

最新推荐文章于 2023-05-02 17:00:24 发布

weixin_39876145

最新推荐文章于 2023-05-02 17:00:24 发布

阅读量239

点赞数

文章标签： python爬虫世界最好大学

上一篇文章，和大家分享的是如何获取信息标记的知识，这篇文章，小编要和大家分享的是使用Python网络爬虫技术来获取大学排名！

当我们想要了解大学排名时，如何在杂乱的网页信息上，快速获取我们想要的大学排名信息了！

这里就需要用到Python网络爬虫提取信息的技术了！

大学排名的程序代码如下：

u=500733347,508113924&fm=173&app=49&f=JPEG?w=640&h=427&s=CFB327C14443274D0698C89403005090 清华大学

#CrawUnivRankingB.py

import requests

from bs4 import BeautifulSoup import bs4

def getHTMLText(url):

try:

r = requests.get(url, timeout=30)

r.raise_for_status()

r.encoding = r.apparent_encoding

return r.text

except: return "" def fillUnivList(ulist, html):

soup = BeautifulSoup(html, "html.parser")

for tr in soup.find('tbody').children:

if isinstance(tr, bs4.element.Tag):

tds = tr('td')

ulist.append([tds[0].string, tds[1].string, tds[3].string])

def printUnivList(ulist, num): tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"

print(tplt.format("排名","学校名称","总分",chr(12288)))

for i in range(num): u=ulist[i] print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main(): uinfo = []

url = 'https://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'

html = getHTMLText(url)

fillUnivList(uinfo, html)

printUnivList(uinfo, 20) # 20 univs main()

u=1904295834,1158596653&fm=173&app=49&f=JPEG?w=640&h=480&s=CA110DC0972E2AAE1AC8F103030070C0 北京大学

通过运行这段程序代码，小编得到的结果是清华大学排第一！

运用好网络爬虫方便我们快速了解信息！

u=1803932779,2460969079&fm=173&app=49&f=JPEG?w=552&h=320&s=65F2AA624BA19AD846D4291E010080C1 爬虫技术

今天小编知识分享就到这里，就结束了！明天同一时间为大家分享更精彩的知识！请大家多多点赞支持，多多关注和收藏，同时祝大家新年快乐！

weixin_39876145

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。