- 博客(11)
- 资源 (7)
- 收藏
- 关注
原创 Java并发编程的Callable、Futrue、FutureTask
在原有的多线程(Thread与Runable)上线程执行方法run()的返回值为void而在在并发包先使用Callable的Call方法的时候是有一个V范型返回。Callable接口源码:@FunctionalInterfacepublic interface Callable<V> { V call() throws Exception;}这个接口是不同与Runable,...
2018-06-10 17:56:49 780
转载 Queue(队列对象)多线程
Queue是python中的标准库,可以直接import Queue引用;队列是线程间最常用的交换数据的形式python下多线程的思考对于资源,加锁是个重要的环节。因为python原生的list,dict等,都是not thread safe的。而Queue,是线程安全的,因此在满足使用条件下,建议使用队列初始化: class Queue.Queue(maxsize) FIFO 先进先出包中的常用...
2018-06-06 23:34:44 1625
转载 数据提取之JSON与JsonPATH
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。JSON和XML的比较可谓不相上下。Python 2.7中自带了JSON模块,直接import json就可以使用了。官方文档:http://docs.python.org/lib...
2018-06-06 23:33:44 860
转载 CSS 选择器:BeautifulSoup4
和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。BeautifulSoup 用来解析 HTML 比较简单,API非常人性化,支持CSS选择器...
2018-06-06 23:32:52 628
转载 python使用XPath工具
什么是XPath?XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。W3School官方文档:http://www.w3school.com.cn/xpath/index.aspXPath 开发工具开源的XPath表达式编辑工具:XMLQuire(XML格式文件可用)Chrome插件 XPath HelperF...
2018-06-06 23:32:06 4909
转载 Python 的 re 模块
在 Python 中,我们可以使用内置的 re 模块来使用正则表达式。有一点需要特别注意的是,正则表达式使用 对特殊字符进行转义,所以如果我们要使用原始字符串,只需加一个 r 前缀,示例:r'chuanzhiboke\t\.\tpython're 模块的一般使用步骤如下:使用 compile() 函数将正则表达式的字符串形式编译为一个 Pattern 对象通过 Pattern 对象提供的一系列方...
2018-06-06 23:30:44 207
转载 Requests: 让 HTTP 服务人类
虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用:)Requests 继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池,支持使...
2018-06-05 14:29:36 477
转载 urllib2 的异常错误处理
在我们用urlopen或opener.open方法发出一个请求时,如果urlopen或opener.open不能处理这个response,就产生错误。这里主要说的是URLError和HTTPError,以及对它们的错误处理。URLErrorURLError 产生的原因主要有:没有网络连接服务器连接失败找不到指定的服务器我们可以用try except语句来捕获相应的异常。下面的例子里我们访问了一个不...
2018-06-05 14:27:16 1819
转载 urllib2的Handler处理器 和 自定义Opener(使用cookielib模拟登陆)
opener是 urllib2.OpenerDirector 的实例,我们之前一直都在使用的urlopen,它是一个特殊的opener(也就是模块帮我们构建好的)。但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级功能。所以要支持这些功能:使用相关的 Handler处理器 来创建特定功能的处理器对象;然后通过 urllib2.build_opener()方法使...
2018-06-05 14:05:55 603
转载 urllib2默认只支持HTTP/HTTPS的GET和POST方法
urllib.urlencode()urllib 和 urllib2 都是接受URL请求的相关模块,但是提供了不同的功能。两个最显著的不同如下:urllib 仅可以接受URL,不能创建 设置了headers 的Request 类实例;但是 urllib 提供 urlencode 方法用来GET查询字符串的产生,而 urllib2 则没有。(这是 urllib 和 urllib2 经常一起使用的主要...
2018-06-05 13:49:48 1765
转载 urllib2库的基本使用
所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib2。urllib2 是 Python2.7 自带的模块(不需要下载,导入即可使用)urllib2 官方文档:https://docs.python.org/2/library/urllib2.htmlurllib2 源码:https://hg.python...
2018-06-05 13:41:29 292
axis2客户端调用webService的DEMO
2018-01-19
锋利的jQuery实例源码
2017-09-09
锋利的jQuery高清版
2017-09-09
java与模式
2017-07-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人