爬虫-xpath-爬取58二手房中的房源信息

最新推荐文章于 2024-07-20 17:12:48 发布

薄荷杂学

最新推荐文章于 2024-07-20 17:12:48 发布

阅读量627

点赞数 1

分类专栏： # 爬虫实战文章标签： xpath python 爬虫

本文链接：https://blog.csdn.net/weixin_43825323/article/details/115602615

版权

爬虫实战专栏收录该内容

7 篇文章 1 订阅

订阅专栏

需求

爬取58二手房中的房源信息
网站：https://bj.58.com/ershoufang/
在这里插入图片描述

代码

import requests
from lxml import etree

headers = {
    'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36 Edg/88.0.705.56'
}
#爬取到页面源码数据
url='https://bj.58.com/ershoufang/'
page_text = requests.get(url=url,headers=headers).text
#print(page_text)

#实例化etree对象
html = etree.HTML(page_text)
#选取所有div元素，且这些元素拥有值为property的class属性。
div_list = html.xpath('//div[@class="property"]')
for div in div_list:
    #局部解析
    title = div.xpath('./a/div[@class="property-content"]/div/div[@class="property-content-title"]/h3/text()')[0]
    print(title)

运行效果

在这里插入图片描述

薄荷杂学

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
爬虫-xpath-爬取58二手房中的房源信息

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例
复制链接

扫一扫

专栏目录