imgs = html.xpath(’//div[@class=“page-content text-center”]//img[@class!=“gif”]’)
for img in imgs:
img_url = img.get(‘data-original’)
# .get()是获取某个属性的值,得到的是字符串;和 /@属性 作用一样 alt = img.get(‘alt’)
#获取a标签下的文本
xpath("//a/text()") # world
#获取a标签以及子标签中的内容
xpath("//a//text()") # hello world
#获取a标签中的连接
xpath("//a/@href") # www.some.com
即获取标签属性值 (位置/@属性)