学习内容,来源于百度搜索
工具及环境
1、python版本:python 3.7.3
2、安装工具:beautifulsoup
3、系统环境:Windows10
4、浏览器:chrome
网页分析
image.png
image.png
F12控制台,根据页面检查前端源码,找到想要爬取内容的对应链接
关键分析
html = getHtml("http://www.zhrczp.com/jobs/jobs_list/key/%E5%BB%BA%E6%98%8E%E9%95%87/page/1.html")
soup = BeautifulSoup(html, 'lxml') #声明BeautifulSoup对象
hrefbox = soup.find_all("div","td-j-name",True);
links = [];
for href in range(0,len(hrefbox)):
links.append("http://www.zhrczp.com"+hrefbox[href].contents[0].get('href'));#拼接链接
分析页面ÿ