Python
文章平均质量分 79
Ivan_ken
Stay hungry.Stay foolish.
展开
-
Html文本的解析库BeautifulSoup
前言 python爬虫系列文章的第3篇介绍了网络请求库神器 Requests ,请求把数据返回来之后就要提取目标数据,不同的网站返回的内容通常有多种不同的格式,一种是 json 格式,这类数据对开发者来说最友好。另一种 XML 格式的,还有一种最常见格式的是 HTML 文档,今天就来讲讲如何从 HTML 中提取出感兴趣的数据 自己写个 HTML 解析器来解析吗?还是用正则表达式?这转载 2017-09-21 13:54:47 · 657 阅读 · 0 评论 -
Xpath语法与lxml库的用法
参考来源 lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。 lxml XPath语法参考 w3school w3school 安装 1 pip install lxml 利用 pip 安装即可 XPath语法 XPath 是一门在 XML转载 2017-09-21 21:57:04 · 489 阅读 · 0 评论 -
什么是multipart/form-data请求
什么是multipart/form-data请求 根据http/1.1 rfc 2616的协议规定,我们的请求方式只有OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE等,那为为何我们还会有multipart/form-data请求之说呢?这就要从头来说了。 http协议规定以ASCII码传输,建立在tcp,ip协议智商的引用规范,规范内容把http请转载 2017-09-22 17:03:08 · 370 阅读 · 0 评论