python怎么爬取研究生排名-使用python爬虫爬取最好大学网大学排名实例

最新推荐文章于 2022-04-14 00:54:12 发布

weixin_39907526

最新推荐文章于 2022-04-14 00:54:12 发布

阅读量308

点赞数

使用requests库和BeautifulSoup库实现对最好大学网大学排名信息爬取

代码:

import requests

from bs4 import BeautifulSoup

import bs4

#从网络上获取大学排名网页内容

def getHTMLText(url):

try:

r =requests.get(url,timeout=30)

r.raise_for_status()

r.encoding = r.apparent_encoding

return r.text

except:

return ""

#提取网页内容中信息到合适的数据结构

def fillUnivList(ulist,html):

soup = BeautifulSoup(html,"html.parser")

for tr in soup.find("tbody").children:

if isinstance(tr,bs4.element.Tag):

tds = tr("td")

ulist.append([tds[0].string,tds[1].string,tds[3].string])

#利用数据结构展示并输出结果

def printUnivList(ulist,num):

tplt = "{0:^10} {1:{3}^10} {2:^10}"

print(tplt.format("排名","学校名称","总分",chr(12288)))

for i in range(num):

u = ulist[i]

print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main():

uinfo = []

url = "http://www.zuihaodaxue.com/Greater_China_Ranking2019_0.html"

html = getHTMLText(url)

fillUnivList(uinfo,html)

printUnivList(uinfo,20)

main()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39907526

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python爬取大学排名_使用Python爬取最好大学网大学排名

weixin_36249618的博客

02-04

237

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码，供大家参考，具体内容如下源代码： #-*-coding:utf-8-*-'''''Created on 2017年3月17日@author: lavi'''import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url):try:r = reques...

python爬取机械专业考研大学排名并保存到TXT文档中

12-23

python爬取机械专业考研大学排名 今天写了一个简单简单的爬虫，用来爬取自己专业的考研大学排名，思想比较简单，但是可能是初学者的原因，写的过程比较繁琐，希望大家理解，下面看一下代码 # -*- coding:utf-8 -*- # -Author-= JamesBen # Email: 1597757775@qq.com import requests import re import time def get_HTMLText(url): try : use = {'User-Agent': 'Mozilla/5.0'} #此行代码骗过服务器我们是使用浏览器

参与评论您还未登录，请先登录后发表或查看评论

排名怎么查_2020考研初试成绩排名怎么查？这些院校已公布初试成绩排名

weixin_39951112的博客

12-24

896

2020考研初试成绩公布后，很多同学都想知道2020考研初试成绩排名怎么查，那么为什么要查成绩排名呢？它对你能否进入复试又有什么影响呢？目前以下这些院校已经公布成绩排名查询方式，接下来跟随中公考研小编一同来看都有哪些学校。　　　　首先我们要明确为什么要查询初试成绩排名呢?　　因为比起具体分数，决定能否进复试更重要的可能是自己在本专业全部考生中的排名。光过线也有可能进不了复试，往年有初试400+却进...

21考研成绩出了！初试排名可查！

mon_star°的博客

02-26

1366

考研政治题库，考研政治刷题神器，微信搜一搜小程序：考研刷题小博士。重磅：考研出分了！一定高分上岸！大家早上好呀，我是考研刷题小博士，你考研路上暖心且专业的能手助你考上研究生 今天，元宵节今天，四六级出分今天，考研出分从今天早上开始就陆续出分了我也收到了很多人的报喜 402分，你就是最靓的仔为了大家能够查分更方便今天研招网再次开通准考证下载简直不要更人性化 ???????????? 1、关注“研招网服务号（微信号：chsiyz） 2、点击菜单栏

简单python爬虫最好大学网

12-26

简单的python爬虫小案例，爬取了最好大学网大学排名信息，并存入mysql数据库，制作地区大学分布数量柱状图，词云。可用作大作业参考使用，内附带文档、源码、注释

使用Python爬取最好大学网大学排名

09-20

在本篇文章中，主要介绍了如何使用Python编程语言从最好大学网（***）上爬取大学排名信息。这一技能在数据挖掘、数据分析以及信息收集方面具有重要的应用价值。以下将详细介绍文章中包含的关键知识点。 1. Python...

Python爬虫实例-爬取豆瓣Top250-保存为表格

11-06

Python爬虫实例-爬取豆瓣Top250-保存为表格

Python爬虫实例爬虫实例-城市公交网络站点数据的爬取方法城市公交网络站点数据的爬取

最新发布

11-02

本实例将详细讲解如何利用Python爬虫技术来抓取城市公交网络站点的数据。首先，我们需要了解Python爬虫的基本概念。Python爬虫是通过编写特定的代码，模拟浏览器行为，向服务器发送请求，获取网页内容，并解析这些...

高校最低录取分数线的查询源代码

10-13

问题描述：现要开发一个开放式的高校本科招生最低录取分数线的查询系统，供师生和学生家长等查询，高校自愿放入该校的信息，可能随时有高校加入。功能要求：要求实现的查询功能有： (1) 查询等于用户给定分数的高校； (2) 查询大于(或小于)用户给定分数的高校； (3) 查询最低录取分数线在用户给定的分数段中的高校。

最好大学网python爬虫代码

ORIGINAL GEOMETRY

04-28

773

#爬虫代码由北京理工课程内容课程所书写 #最好大学网无robots协议 #2017/4/28函数过于简单，不再赘述 import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.ra

python查询高校信息_[python]从最好大学网获取大学排名

weixin_39804059的博客

11-29

538

按照北京理工嵩天老师课程代码，一步步实现。首先查看最好大学网是否存在robots：404.png可知不存在robots.txt文档从最好大学网获取大学排名信息并存储最好大学网排名.png查看目标网页源代码，确认待存储项在网页代码中的结构：网页源代码.png一个学校信息是由一个标签内存储的多个标签信息。代码如下：import requestsfrom bs4 import BeautifulSoup...

排名怎么查_2020考研成绩排名怎么查？看这里！！

weixin_39827304的博客

12-24

255

阅读本文前，请您先点击上面的“蓝色字体”，再点击“关注”，这样您就可以继续免费收到文章了。每天都会有分享，都是免费订阅，请您放心关注。注：本文转载自网络，不代表本平台立场，仅供读者参考，著作权属归原创者所有。我们分享此文出于传...

计算机考研代码排名,浙江大学2011计算机根据扣分情况重新排名代码

weixin_42309083的博客

07-09

212

#include#includeusing namespace std;int count=0;typedef struct{int z,y,s,j,t;}node;bool operator < (node a,node b){if (a.t != b.t)return a.t < b.t ;else if(a.t == b.t)return a.y < b.y ;else i...

Python爬去最好大学排名代码

weixin_47434673的博客

04-14

1243

Python爬取最好大学排名代码：import bs4from urllib import requestfrom bs4 import BeautifulSoup’’’（）获取网站页面’’‘def getHTMLText(url): try: resp=request.urlopen(url) html_data=resp.read().decode(‘utf-8’) return html_data except: return “”’

这些学校可以查考研成绩排名！

计算机与软件考研

03-09

410

从出成绩到现在，很多同学都在关注成绩排名的问题。目前网上非官方的排名都是不靠谱的，有一些甚至还会影响我们的判断。有部分院校在最初查成绩的时候就已经同时发布了专业排名，比如北京协和医学院、北...

Python爬虫-暨大考研报录比

LicalKi的博客

06-29

2732

关于学习爬虫这个事情，我和它的缘分起源于某位讨厌的老师的期末项目作业，那是个为了开拓学生自学能力的好老师嗯。emmmmm于是在掉了三天头发后，我还要被迫来写博客，感觉也是一种奇妙的体验，算是达成了“人生第一次写博客”成就吧，nice。那么现在我来share一下为了python爬虫我这三天是如何学习的吧头发是如何掉的吧：( 关于python爬虫，首先要了解的当然是python了，python...

html考研网页,考研有这几个网站就行了

weixin_29775479的博客

06-18

376

欢迎来到教学星球，我们一起终生学习！今天我们来说说考研需要用到的网站有哪些。其实，考研只需要这几个网站就够了。1、中国研究生招生信息网(https://yz.chsi.com.cn/)研招网是发布考研信息的官方网站，最具权威性。统考报名、打印准考证、推荐免试、网上调剂都必须在这里进行操作。除了上述最基本的功用之外，研招网还能在“院校库”中查看报考院校是否自主划线、院校隶属、招生简章、调剂办法等信息...