记录自己用xpath时候的几个小tips | 以及用python存储、读取文件

一:

用xpath选取节点的时候,有的时候选出来是一个
<Element input at 0x1b2bdaf0948>,这应该是一个对象吧?
类型是<class ‘lxml.etree._Element’>。

但是有些时候,这个对象是在列表中。
在这里插入图片描述
我也不知道是什么原因,但如果在列表中,那么就把元素选取出来。
在这里插入图片描述

二:直接子节点和所有子节点

在xpath中,如果想选取子节点,可以用"/“或”//",其中用单斜杠是选取直接子节点,而用双斜杠是选取所有的子节点。

所有子节点:
在这里插入图片描述

直接子节点:
在这里插入图片描述

保存文件

写爬虫的时候,我有时会把登录页面保存下来,然后慢慢尝试怎么用xpath或者css选择器选取特定的节点,比如填写账号的窗口、填写密码的窗口、或者登录按钮等等。

如何保存读取文件?

f = open(‘文件名’,‘读写方式’,encoding=“编码方式”)
f.write()
f.close()

例如:
在这里插入图片描述

读取:
with open() as f:
text = f.read()
f.close()
在这里插入图片描述

做个记录,以免自己以后忘记了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值