【python路上小记】request请求html并使用Xpath提取

最新推荐文章于 2024-05-14 22:18:18 发布

杰瑞1996

最新推荐文章于 2024-05-14 22:18:18 发布

阅读量473

点赞数

文章标签： xpath html python xml

本文链接：https://blog.csdn.net/qq_43152507/article/details/114383567

版权

使用 lxml提取

from lxml import etree
import re
import requests

ulr = 'www.csdn.net'
response = requests.get(url)
req = etree.HTML(response)
try:
	# 根据相应的xpath规则提取
	text = req.xpath("//body/div[3]/div[2]/div[1]/div[2]/div/p[3]/span/font/text()")[0] 
    text2 = req.xpath("//body/div[3]/div[2]/div[1]/ul/li[1]/text()")[0]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

杰瑞1996

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
【python路上小记】request请求html并使用Xpath提取

from bin import request_htmlfrom lxml import etreeimport reresponse = request.get(url)req = etree.HTML(response)try:# 根据相应的xpath规则提取text = req.xpath("//body/div[3]/div[2]/div[1]/div[2]/div/p[3]/span/font/text()")[0]text2 = req.xpath("//body/div[3]/
复制链接

扫一扫