Python爬取网上电话号码
今天我们来做一个关于爬取电话号码并写入Excel的简单项目,希望这个项目能够对大家有所帮助,如果项目中有什么问题或者不足的地方,还希望各位大佬多多指教!!
-
获取下面电话号码的网址(https://tel.911cha.com/)
-
通过正则表达式获取每个名称和电话号码
-
下载并引入xlsxwrite第三方模块
-
代码如下:
import requests
import re
import xlsxwriter
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18362'}
url=r'http://tel.911cha.com/'
res=requests.get(url,headers=header).content.decode()
# <span class="pink ml">119</span></li><li>急救
pat1=r'<span class="pink ml">(.*?)</span>' #获取电话号码
pat2=r'</li><li>(.*?)<span' #名称
result1=re.compile(pat1,re.I)
result2=re.compile(pat2,re.I)
data1=result1.findall(res)
data2=result2.findall(res)
datalist=[]
workbook=xlsxwriter.Workbook('C:\\Users\\lenovo\\Desktop\\demo.xlsx')
worksheet=workbook.add_worksheet()
for i in range(0,len(data2)):
worksheet.write('A'+str(i+1),data2[i])
worksheet.write('B'+str(i+1),data1[i])
workbook.close()
最后运行程序,将数据写入Excel中:
这样,简单的项目就完成了。。。