前言
以下文章来源于数据分析和Python ,作者冈坂日川
今天发的是python爬虫爬取中国大学排名,并且保存到excel中,当然这个代码很简单,我用了半小时就写完了,我的整体框架非常清晰,可以直接拿去用,也希望有小白可以学习到关于爬虫的一些知识,当然我也只是在学习中,有不好的地方还麻烦大佬们指正!谢谢!
爬取中国大学排名
URL : http:// m.gaosan.com/gaokao/265 440.html
request 获取 html
beautiful soup 解析网页re 正则表达式匹配内容新建并保存 excel
1from bs4 import BeautifulSoup # 网页解析 获取数据
2import re # 正则表达式 进行文字匹配
3import urllib.request, urllib.error # 制定url 获取网页