scrapy中的xpath使用

环境安装

打开cmd,pip install scrapy安装scrapy,然后去下载twisted.whl,官方下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
安装方法:pip install whl文件的路径+名字

scrapy shell调试(win10)

安装完后使用scrapy shell url,这里我分析一个房产网:
https://fangjia.fang.com/pghouse-c0bj/h315-s11/

在>>>里输入命令,可以对取回的内容即response可以对其进行xpath操作。想看页面内容可以用response.text
下一步进入网页查看你想取出的内容,比如取出里面的一队div
在这里插入图片描述
在这里插入图片描述
这里使用xpath取出来的是selector选择器,可以对选择器进行进一步操作,如取div内标签属性为housetitle的内容
在这里插入图片描述
text()取出标签里的内容,使用extract()提取selector中的内容,取出后是列表,所以使用extract_first()取列表的第一个元素,使用strip()去掉字符串的前后空格。
然后你就可以把xpath放到scrapy项目中用了,一般不会直接把浏览器里调试的xpath放到项目里,应为在项目中取到的页面和浏览器中显示的会有出入。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值