url
文章平均质量分 78
qq_15551663
这个作者很懒,什么都没留下…
展开
-
handle处理器和自定义opener
handle处理器和自定义opener 本文将介绍handler处理器和自定义opener,更多内容请参考:python学习指南 opener和handleer 我们之前一直使用的是urllib2.urlopen(url)这种形式来打开网页,它是一个特殊的opener(也就是模块帮我们建好的),opener是urllib2.OpenerDirectory的实例。 但是...转载 2018-09-19 15:08:56 · 290 阅读 · 0 评论 -
XPath
XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。 XPath 路径表达式 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。 XPath 标准函数 XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName ...原创 2018-09-27 09:27:10 · 205 阅读 · 0 评论 -
爬虫
爬虫程序的流程 下载页面-->提取页面中的数据-->提取页面中的链接-->URL去重 Scrapy简介及安装 在任意操作系统下,可以使用pip安装Scrapy,例如: $pip install scrapy 为确认Scrapy已安装成功,首先在Python中测试能否导入Scrapy模块: >>> import scrapy ...原创 2018-09-30 14:15:21 · 226 阅读 · 0 评论