xpath解析01

wtbsm

于 2021-08-05 23:03:25 发布

阅读量52

点赞数

本文链接：https://blog.csdn.net/ouat2018/article/details/119429443

版权

该代码示例展示了如何使用Python的requests和lxml库从58同城网站爬取并解析深圳地区的二手房房源信息。具体实现包括设置User-Agent以伪装浏览器，获取页面源码，然后利用XPath解析HTML，提取房源标题并保存到文件中。

摘要由CSDN通过智能技术生成

爬取58同城二手房中的房源信息

from lxml import etree
import requests
# 爬取页面源码数据
url = 'https://sz.58.com/ershoufang/'
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 '
                 'Safari/537.36'
}
page_text = requests.get(url=url,headers=headers).text
# 解析数据
tree = etree.HTML(page_text)
li_list = tree.xpath = ('//section[@class="list"]/div')
fp = open('58.txt','w',encoding='utf-8')
for li in li_list:
    # 局部解析
    title = li.xpath('./div[2]/div[1]/div[1]/h3/text()')[0]
    print(title)
    fp.write(title + '\n')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wtbsm

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
xpath解析01

爬取58同城二手房中的房源信息from lxml import etreeimport requests# 爬取页面源码数据url = 'https://sz.58.com/ershoufang/'headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 ' '
复制链接

扫一扫