爬虫
lnterpreter
这个作者很懒,什么都没留下…
展开
-
xpath基操
Xpath解析 环境安装: pip install lxml 解析原理: -1.实例化一个etree的对象,且将带解析的页面源码数据加载到该对象中 -2.调用etree对象的xpath方法结合着不同的xpath表达式实现标签的定位和数据提取 -实例化etree对象 etree.parse(‘filename’):将本地html文档加载到该对象中 etree.html(page_text...原创 2020-04-23 12:37:07 · 116 阅读 · 0 评论 -
bs4基操
-环境安装 pip install lxml pip install bs4 - BeautifulSoup对象的实例化: BeautifulSoup(fp,‘lxml’):用来将本地存储的html文档中的数据进行解析 BeautifulSoup(page_text,‘lxml’):用来将互联网上请求到的页面源码数据进行解析 - 标签定位: soup.tagName:只可以定位到第一次...原创 2020-04-22 15:25:22 · 119 阅读 · 0 评论