要用python关联爬取数据,保存到数据库中
分两步,第一步就是爬取数据,第二步才是保存到数据库
-
爬取数据
需要的头文件有:
# -*- coding:UTF-8 -*-
import pymysql as mdb
import pymysql.cursors
import requests
from bs4 import BeautifulSoup
import bs4
-
解析网址
def getHTMLText(url):
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
-
爬取数据
def fillnameList(ulist1, html):
soup = BeautifulSoup(html, "html.parser")
a = soup.find('div', class_='hcent_m1j_2n').findAll("dt")
for i in a:
tds = i("a")
ulist1.append([tds[0].string])