python爬虫网页解析之lxml模块

最新推荐文章于 2024-07-09 15:58:38 发布

aiyulove201314

最新推荐文章于 2024-07-09 15:58:38 发布

阅读量211

点赞数

文章标签：爬虫 python

原文链接：http://www.cnblogs.com/pythonywy/p/11311094.html

版权

08.06自我总结

windows系统下的安装：

方法一:pip3 install lxml

方法二:下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

pip3 install lxml-4.2.1-cp36-cp36m-win_amd64.whl #文件所在的路径

linux下安装：

方法一:pip3 install lxml

方法二:yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

from lxml.html import etree

演示

import requests
from lxml.html import etree

rp = requests.get('http://www.baidu.com')
html = etree.HTML(rp.text)
#解析后的对象可以使用xpath进行内容匹配

转载于:https://www.cnblogs.com/pythonywy/p/11311094.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注