Python爬取常用电话号码并将数据存入数据库
今天我又学到一个新知识,就是将爬取到的数据存入数据库,刚开始学,弄了好久,希望这个小知识能帮助到更多的初学者!!!
首先啦,我们要找到常用电话号码的网址,然后用正则表达式或者xpath来获取想要的名称和电话号码,今天我们主要讲的是如何将爬取到数据存入数据库
第一、 导入第三方模块pymssql
第二、 创建表B
import pymssql
db=pymssql.connect(server='LAPTOP-CRN5E8BP',database='E_Market',charset='utf8')
cursor=db.cursor()
sql='''
CREATE TABLE B(
ID int NOT NULL,
name varchar(20) NOT NULL,
phone varchar(20) NOT NULL)
'''
cursor.execute(sql)
db.commit()
db.close()
第三、导入数据库,代码如下:
import re
import requests
import pymssql
db=pymssql.connect(server='LAPTOP-CRN5E8BP',database='E_Market',charset='utf8')
cursor=db.cursor()
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18362'}
response=requests.get(r'http://changyongdianhuahaoma.51240.com/',headers=header).text
# print(response)
pat1=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>(.*?)</td>[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?</tr>'
pat2=r'<tr bgcolor="#EFF7F0">[\s\S]*?<td>[\s\S]*?</td>[\s\S]*?<td>(.*?)</td>[\s\S]*?</tr>'
patt1=re.compile(pat1)
patt2=re.compile(pat2)
data1=patt1.findall(response)
data2=patt2.findall(response)
resultlist=[]
sqll="delete from B"
cursor.execute(sqll)
db.commit()
for i in range(0,len(data1)):
resultlist.append(data1[i]+data2[i])
sql="INSERT INTO B(ID,name,phone) VALUES (%d,%s,%s)"
cursor.execute(sql,((i+1),data1[i],data2[i]))
db.commit()
db.close()
print(resultlist)
第四、运行程序,查看数据库
这样数据就成功导入了,支持这篇文章的老铁们,请给个赞吧,有赞有动力,以后我会继续为大家分享更多的小知识!