1.我们应该先找到需要查询的网站,我这里是用的贝壳租房
我们需要在这里获取该网页的url地址,
再点击F12查看该网站的网页内容
在解析该网页的内容网址
再获取解析之后的内容,以便后续的使用
2.我们先创建一个名叫"贝壳租房"的文件
再将之前获取的网页内容粘贴进去
再将贝壳租房的网址添加进去,方便之后的访问
3.拼接地址,实现翻页
4.定义写入方法
我们这里使用的是csv格式定义写入的方法
5.我们再用etree来解析网页
6.再获取各小区的xpath地址,再使用for循环来依次获取各个小区的名称,地址,价格,并将各个房子的信息添加到数组中去,调用方法并写入数组
7.运行并查看结果
这就是我们搜集好的信息
我们在资源管理器中打开它
这样就可以更好地对比各个房子的价格了。