Python爬取中国前30名大学
最近在学习爬虫,学习任务中有一个爬取中国前30名的大学,按着教程来爬一直有bug,网上的代码没找到一个能用的…自己探索出来一个供大家学习一下(ps:排名30以后的大学是需要抓包才能爬到么?希望有大佬指点一下)
import requests
import pandas as pd
from bs4 import BeautifulSoup
import bs4
# 爬取中国前一百名的大学
# 获取html
def get_html(url):
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400"}
try:
res = requests.get(url, headers=headers, timeout