怎么看&ltElement xxx at xxxxxx&gt的源码、属性

最新推荐文章于 2023-02-04 18:59:23 发布

看见我书了吗

最新推荐文章于 2023-02-04 18:59:23 发布

阅读量4k

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_43572758/article/details/104488648

版权

爬虫专栏收录该内容

19 篇文章 0 订阅

订阅专栏

抓出来的<Element xxx at xxxxxx>是什么？
①它其实是<class ‘lxml.etree._Element’>
②可以用tostring()方法获取它的源码
③可以用/@xxx获取它的属性
④可以用/text()获得标签的文本

举例说明：

import lxml
from lxml import etree
from lxml.etree import tostring

page = '''
    此处省略
    '''
html = etree.HTML(page)
element = html.xpath('/img')[0]  #html.xpath('/img')得到的是列表，[0]取第一个元素

print("element：", element)
print("element的类型：", type(element))
print("element的源码：", tostring(element))
print("element的属性class和src：", element.xpath('./@class'), element.xpath('./@src'))

输出结果：

element： <Element img at 0x1f29d5b38c8>
element的类型： <class 'lxml.etree._Element'>
element的源码： b'<img class="lazyload" src="xxx.jpg"/>'
element的属性class和src：['lazyload'] ['xxx.jpg']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

看见我书了吗

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
怎么看&ltElement xxx at xxxxxx&gt的源码、属性

抓出来的<Element xxx at xxxxxx>是什么？它其实是<class ‘lxml.etree._Element’>，可以用tostring（）方法获取它的源码，可以用/@src获取它的属性举例说明：import lxmlfrom lxml import etreepage = ''' 此处省略 '''html = etree....
复制链接

扫一扫