一:
用xpath选取节点的时候,有的时候选出来是一个
<Element input at 0x1b2bdaf0948>,这应该是一个对象吧?
类型是<class ‘lxml.etree._Element’>。
但是有些时候,这个对象是在列表中。
我也不知道是什么原因,但如果在列表中,那么就把元素选取出来。
二:直接子节点和所有子节点
在xpath中,如果想选取子节点,可以用"/“或”//",其中用单斜杠是选取直接子节点,而用双斜杠是选取所有的子节点。
所有子节点:
直接子节点:
保存文件
写爬虫的时候,我有时会把登录页面保存下来,然后慢慢尝试怎么用xpath或者css选择器选取特定的节点,比如填写账号的窗口、填写密码的窗口、或者登录按钮等等。
如何保存读取文件?
f = open(‘文件名’,‘读写方式’,encoding=“编码方式”)
f.write()
f.close()
例如:
读取:
with open() as f:
text = f.read()
f.close()
做个记录,以免自己以后忘记了。