python爬虫类型_Python爬虫：爬取国内所有高校名称、类型、官网

最新推荐文章于 2024-08-08 18:14:07 发布

weixin_39861498

最新推荐文章于 2024-08-08 18:14:07 发布

阅读量1.3k

点赞数

文章标签： python爬虫类型

本文链接：https://blog.csdn.net/weixin_39861498/article/details/111496015

版权

本文介绍了一个使用Python爬虫技术抓取中国各省份高校基本信息的实例，包括高校名称、类型和官网链接。数据通过访问特定黄页获取，并按省份存储为Excel文件，同时对数据进行了清洗，去除编号和特殊标识。

摘要由CSDN通过智能技术生成

本博客仅用于技术讨论，若有侵权，联系笔者删除。

此次的目的是爬取国内高校的基本信息，并按省份存储。爬取的黄页是http://www.gx211.com/gxmd/gx-bj.html。以下是结果图：

一、初始化数据

初始化基本的数据，包括global变量，省份名称等等。

from bs4 import BeautifulSoup

from selenium import webdriver

import pandas as pd

import requests

import csv

from string import digits

#初始化

def init():

global url, headers, province_name, province_url_address, driver

url = 'http://www.gx211.com/gxmd/'

province_name = [

'北京', '天津', '河北', '山西', '辽宁', '吉林', '黑龙江', '上海',

'江苏', '浙江', '安徽', '福建', '江西', '山东', '河南', '湖北',

'湖南', '广东', '

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39861498

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python查询高校信息_Python 3爬取全国高校基本信息-Go语言中文社区

weixin_39689700的博客

11-29

738

最近接了一个单子，是爬取全国高校的基本信息，高校名字，高校层次，高校地区，招生办电话，招生办官网~镇楼图如下：开发环境：python3.6（最新3.7也可以的） +pycharm第三放库：request(网页级请求库)，pymysql（l操作mysql库）,json（python和json互转的库）其余库自带思路就参考前面同前面的文章（最近越来越懒了，请见谅博客都没怎么写了，思路也是...被高数折...

python查询高校信息网_Python爬虫实战之全国高校信息综合查询系统

weixin_34566429的博客

02-21

641

鉴于小编本科专业为遥感科学与技术专业，所以爬取了在全国高校信息综合查询系统查询了遥感科学与技术专业到但现在为止的所有院校。爬取网址：https://gkcx.eol.cn/soudaxue/querySchoolSpecialty.html?&argspecialtyname=%E9%81%A5%E6%84%9F%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫实战之全国高校信息综合查询系统

zhoulong_giser

12-26

2637

Python爬取阳光高考院校库，全国院校列表

VerseImmortal的博客

07-14

1924

Python爬取阳光高考院校库，全国院校列表 1.截止2021年7月14日，共有2756条院校数据 2.使用到的包有 json / time / requests-html 3.可保存为json数组或可执行sql文件 import json import time from requests_html import HTMLSession # 判断是否是数字 def is_number(s): try: float(s) return True excep

阿里系 acw_sc__v3 滑块南方航空分析

最新发布

ff2766958292的博客

08-08

1376

南方航空、阿里、 acw_sc__v3、滑块、南方航空

用Python爬取大学的信息

迷茫与徘徊只会让你陷入绝境，欢迎私信博主，带你开始提升变现价值！

08-11

3942

你知道我们中国有多少个高校吗，你知道它的排名吗，你知道它在哪个地址吗，如果你不知道，那么下面Python爬虫教你知道！获取网页 #这个只用到了requests 和 bs4 #爬取大学排名 import requests from bs4 import BeautifulSoup as bs import time def grthtml(url): demo=requests.get(url) demo.encoding=demo.apparent_encoding#编码解码，常用方法

100大学开设python_Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy

weixin_39712016的博客

12-18

133

爬前叨叨今天要爬取一下正规大学名单，这些名单是教育部公布具有招生资格的高校名单，除了这些学校以外，其他招生的单位，其所招学生的学籍、发放的毕业证书国家均不予承认，也就是俗称的野鸡大学！网址是 https://daxue.eol.cn/mingdan.shtml 爬取完毕之后，我们进行一些基本的数据分析，套路如此类似，哈哈这个小项目采用的是scrapy，关键代码import scrapyfrom s...

python Demo 01 爬取大学名称

韵开

09-27

336

对icourse、学堂在线等网页中的大学名称进行爬取： # to clean data from icourses fi = open("icourses.txt","r",encoding="utf-8") ls = [] for line in fi: if "alt" in line: tokens = line.split('"') uname ...

【Python】爬取高校数据（名字，院校特色，所在地，性质）。可用于判断高校是否为双一流，本科/专科等分析

m0_63011748的博客

05-23

1080

【代码】Python爬取高校数据（名字，院校特色，所在地，性质），可用于判断高校是否为双一流，本科/专科等分析。

mzitu_win_爬虫python_爬虫_python爬取图片_mzitu图片_python爬虫_

10-04

标题中的“mzitu_win_爬虫python_爬虫_python爬取图片_mzitu图片_python爬虫_”表明这是一个关于使用Python爬虫抓取Mzitu网站图片的项目。Mzitu是一个知名的网络平台，主要发布各类美女图片，因此这个项目可能是为了...

Crawling_Baidu_Academic:爬虫：爬取百度学术

05-14

爬虫：爬取百度学术 This websit based on Python Tornado, but i don't use tornado api: core/SelectDetail.py xueshu_search_academic(pn, search_content) 表结构文章表 1. 文章ID article_id 2. 学术标题 ...

python爬虫_微信公众号推送信息爬取的实例

09-21

下面小编就为大家带来一篇python爬虫_微信公众号推送信息爬取的实例。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧

python爬虫.rar_python_python爬取图片_python爬虫_爬虫

07-14

指定一个网站，从该网站上爬取全部匹配的图片到任意指定的文件夹当中，关键是正则表达式的使用

python 爬虫实现增量去重和定时爬取实例_python增量爬虫_爬虫实现增量去重和定时爬取实例_python_wherev

09-30

Python爬虫技术在数据获取和信息处理中扮演着重要角色，尤其在大数据时代，高效、自动化的数据抓取成为必需。本实例将深入探讨如何利用Python实现增量去重和定时爬取，帮助我们构建更加智能和实用的爬虫程序。首先...

Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy

weixin_30698297的博客

02-21

200

python爬取中国大学（高校）基本信息

BanBri的博客

04-18

4045

Python爬取中国大学（高校）基本信息 python爬取中国大学（高校）基本信息简单的一个小爬虫，获取中国高校基本信息一、输出到excel表格结果二、代码 // An highlighted block # -*- coding:utf-8 -*- # author:zhang shuochuan # datetime:2021/4/16 20:23 # software: PyCharm from bs4 import BeautifulSoup import urllib.request,u

Python爬虫实战之爬取全国理工类大学数量+数据可视化

brilliant666的博客

08-04

4494

前面两章，咱们介绍了Beautifulsoup4模块的简单用法，今天咱们就用来爬取高考各省的分数线，并简单实现一个数据可视化。

Python练习-爬虫（附加爬取中国大学排名）

qq_48772498的博客

01-06

5873

Python与网页处理 Python 语言发展中有一个里程碑式的应用事件，即美国谷歌（GOOGLE）公司在搜索引擎后端采用Python 语言进行链接处理和开发，这是该语言发展成熟的重要标志。Python 语言的简洁性和脚本特点非常适合链接和网页处理。万维网（WWW）的快速发展带来了大量获取和提交网络信息的需求，这产生了“网络爬虫”等一系列应用。 Python 语言提供了很多类似的函数库，包括urllib、urllib2、urllib3、wget、scrapy、requests 等。对于爬取回来的网页内容

python爬虫爬取58网站数据_python实战学习笔记：爬取58同城平板电脑数据

06-01

这是一个关于Python爬虫爬取58同城平板电脑数据的学习笔记。这篇文章主要介绍了如何使用Python爬虫技术获取58同城平板电脑的相关数据信息。具体步骤包括： 1. 安装所需的Python库，如requests、beautifulsoup4等。 ...