Scrapy解析响应数据

最新推荐文章于 2023-02-28 15:55:55 发布

谢公子

最新推荐文章于 2023-02-28 15:55:55 发布

阅读量1.7k

点赞数

分类专栏： Python模块的使用

本文链接：https://blog.csdn.net/qq_36119192/article/details/103780106

版权

Python模块的使用专栏收录该内容

35 篇文章 45 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何在Scrapy中解析服务器返回的响应数据，包括使用XPath和CSS选择器的方法。通过示例展示了选取网页元素如title、h2标签以及div内的标题和时间等。

摘要由CSDN通过智能技术生成

解析响应数据

使用xpath选择器解析

使用CSS选择器解析

解析响应数据

对于服务器端返回的数据我们该如何处理呢？我们需要提取从服务器返回的数据，解析的方向有下面这几种：

普通文本操作
正则表达式：re
Dom树操作：BeautifulSoup(解析速度快慢)
Xpath选择器：lxml (基于lxml库建立的，并且简化了API接口，解析速度快)

有如下网页，html代码如下

 <html>
 <head>
    <title>谢公子的小黑屋</title>
 </head>
 <body>
   <h2>这是标题</h2>
   <p class="xie" name="p标签">你好，世界</p>
   <img src="1.jpg">
   <div class="one">
     <div class="two">
         <div class="three">
             <div class="title">这是第一个标题</div>
             <div class="time">2019-1-1 01

了解本专栏

超级会员免费看

谢公子

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
Scrapy解析响应数据

目录解析响应数据使用xpath选择器解析使用CSS选择器解析解析响应数据对于服务器端返回的数据我们该如何处理呢？我们需要提取从服务器返回的数据，解析的方向有下面这几种：普通文本操作正则表达式：re Dom树操作：BeautifulSoup(解析速度快慢) Xpath选择器：lxml (基于lxml库建立的，并且简化了API接口，解析速度快...
复制链接

扫一扫