python的几种获取元素的方法

最新推荐文章于 2024-05-18 17:30:45 发布

码农云云

最新推荐文章于 2024-05-18 17:30:45 发布

阅读量1.7k

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/qq_35815348/article/details/120249387

版权

Python学习之解析HTML文档

1. xpath 解析

1.1 直接通过xpath获取元素

\# pip install lxml
from lxml import etree
import requests 
	\# get 请求
	res = requests.get(url,headers=headers)
	\# 判断请求的状态
	if res.status_code ==200 :
		\# 获取响应的数据
		response = res.content.decode('utf-8')
		res_html = etree.HTML(response)
		ips = res_html.xpath('//table[@id="ip_list"]//tr//td[2]//text()')   
		ports = res_html.xpath('//table[@id="ip_list"]//tr//td[3]//text()')

通过标签 ‘//标签名’ @class=xxx @id=xxx 来获取元素对HTML Dom树中去取，结果是一个集合

2.BeautifulSoup 解析

2.1 fand_all – select 获取元素

\#导包
import requests
from bs4 import BeautifulSoup
	
	\# 解析html find_all 查找元素数据
	soup = BeautifulSoup(response, '

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

码农云云

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python的几种获取元素的方法

Python学习之解析HTML文档1. xpath 解析1.1 直接通过xpath获取元素\# pip install lxmlfrom lxml import etreeimport requests \# get 请求 res = requests.get(url,headers=headers) \# 判断请求的状态 if res.status_code ==200 : \# 获取响应的数据 response = res.content.decode('utf-8')
复制链接

扫一扫