先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新软件测试全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上软件测试知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip1024b (备注软件测试)
正文
- 如何实例化一个etree对象:
- xpath(‘xpath表达式’)
- xpath爬取58二手房实例
- 爬取网址
- 完整代码
- 效果图
- xpath图片解析下载实例
- 爬取网址
- 完整代码
- 效果图
- xpath爬取全国城市名称实例
- 爬取网址
- 完整代码
- 效果图
- xpath爬取简历模板实例
- 爬取网址
- 完整代码
- 效果图
xpath基本概念
xpath解析:最常用且最便捷高效的一种解析方式。通用性强。
xpath解析原理
1.实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中
2.调用etree对象中的xpath方法结合xpath表达式实现标签的定位和内容的捕获。
环境安装
pip install lxml
如何实例化一个etree对象:
from lxml import etree
1.将本地的html文件中的远吗数据加载到etree对象中:
etree.parse(filePath)
2.可以将从互联网上获取的原码数据加载到该对象中:
etree.HTML(‘page_text’)
xpath(‘xpath表达式’)
- /:表示的是从根节点开始定位。表示一个层级
- //:表示多个层级。可以表示从任意位置开始定位
- 属性定位://div[@class=‘song’] tag[@attrName=‘attrValue’]
- 索引定位://div[@class=‘song’]/p[3] 索引从1开始的
取文本:
- /text()获取的是标签中直系的文本内容
- //text()标签中非直系的文本内容(所有文本内容)
- 取属性:/@attrName ==>img/src
xpath爬取58二手房实例
爬取网址
https://xa.58.com/ershoufang/完整代码
from lxml import etree
import requests
if name == ‘main’:
headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36’
}
url = ‘https://xa.58.com/ershoufang/’
page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
div_list = tree.xpath(‘//section[@class=“list”]/div’)
fp = open(‘./58同城二手房.txt’,‘w’,encoding=‘utf-8’)
for div in div_list:
title = div.xpath(‘.//div[@class=“property-content-title”]/h3/text()’)[0]
print(title)
fp.write(title+‘\n’+‘\n’)
xpath图片解析下载实例
爬取网址
https://pic.netbian.com/4kmeinv/完整代码
import requests,os
from lxml import etree
if name == ‘main’:
headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36’
}
url = ‘https://pic.netbian.com/4kmeinv/’
page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
li_list = tree.xpath(‘//div[@class=“slist”]/ul/li/a’)
if not os.path.exists(‘./piclibs’):
os.mkdir(‘./piclibs’)
for li in li_list:
detail_url =‘https://pic.netbian.com’ + li.xpath(‘./img/@src’)[0]
detail_name = li.xpath(‘./img/@alt’)[0]+‘.jpg’
detail_name = detail_name.encode(‘iso-8859-1’).decode(‘GBK’)
detail_path = ‘./piclibs/’ + detail_name
detail_data = requests.get(url=detail_url, headers=headers).content
with open(detail_path,‘wb’) as fp:
fp.write(detail_data)
print(detail_name,‘seccess!!’)
xpath爬取全国城市名称实例
爬取网址
https://www.aqistudy.cn/historydata/完整代码
import requests
from lxml import etree
if name == ‘main’:
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注软件测试)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
升。**
需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注软件测试)
[外链图片转存中…(img-fLOSlGSG-1713446509602)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!