自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python爬虫mac版本项目

爬虫概念、工具和HTTP1.什么爬虫爬虫就是模拟客户端(浏览器)发送网络请求,获取响应,按照规则提取数据的程序模拟客户端(浏览器)发送网络请求 : 照着浏览器发送一模一样的请求,获取和浏览器一模一样的数据2.爬虫的数据去哪了呈现出来:展示在网页上,或者是展示在app上进行分析:从数据中寻找一些规律3.需要的软件和环境python3黑马python基础班15天...

2020-01-02 20:09:12 441

python爬虫mac版本猪精原创

python mac版爬虫 - 豆瓣电视爬虫案例 ### xpath和lxml - xpath - 一门从html中提取数据的语言 - xpath语法 - xpath helper插件:帮助我们从`elements`中定位数据 - 1. 选择节点(标签) - `/html/head/meta` :能够选中html下的head下的所有的meta标签 - 2. `//` :能够从任意节点开始选择 - `//li` :当前页面上的所有的li标签 - `/html/head//link` :head下的所有的link标签 - 3. `@符号的用途` - 选择具体某个元素:`//div[@class='feed']/ul/li` - 选择class='feed'的div下的ul下的li - `a/@href` :选择a的href的值 - 4. 获取文本: - `/a/text()` :获取a下的文本 - `/a//text()` :获取a下的所有的文本 - 5. 点前 - `./a` 当前节点下的a标签 - lxml - 安装:pip install lxml - 使用 ```pthon from lxml import etree element = etree.HTML("html字符串") element.xpath("") ```

2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除