Python爬虫
木叶动秋色
这个作者很懒,什么都没留下…
展开
-
Python爬虫xpath解析基础和项目实战
1.xpath解析基础01 xpath解析:最常用且最高效的一种解析方式,通用性 xpath解析原理: 1.实例化etree对象,且需要将被解析的页面源码数量加载到该对象中。 2.调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获 环境的安装: pip install lxml 如何实例化一个etree对象 1.将本地的htnl源码数据加载到etree对象中 etree.parse(filPath) #返回一个etree对象 2.可以将从互联网上获取原创 2021-04-23 17:22:19 · 303 阅读 · 1 评论 -
Python爬虫bs4解析描述
1.bs4解析概述 环境安装 pip install bs4 pip install lxml 如何实例化BeautifulSoup对象: from bs4 import BeautifulSoup 对象的实例化: 1.将本地的html文档中的数据加载到该对象中 fp = open('./test.html','r',encoding = 'utf-8') soup = BeautifulSoup(page_text,'lxml') 2.将互联网上获取的页面源码加载到该对象中原创 2021-04-23 16:59:44 · 283 阅读 · 1 评论