一、使用Python的BeautifulSoup访问[http://www.ip138.com]查询
本方法大致的思路如下:
a)获取页面信息
b)解析返回的页面信息
c)保存查询到的信息到Excel文件
1.新建项目:
2.新建一个Python package phoneSectionInfo
3.新建Python文件 PhoneSectionInfo.py
4.访问页面函数:
# 1.访问页面函数
def getHTMLText(url):
try:
r = requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except Exception as err:
print(err)
5.解析页面信息函数:
# 2.解析页面返回的信息
def parsePhoneData(html):
soup = BeautifulSoup(html, "html.parser")
table = soup.find('table',attrs={'style':'border-collapse: collapse'})
phoneInfoList = [] # 用于存放电话信息
for td in table.find_all('td',attrs=