- 博客(6)
- 资源 (12)
- 收藏
- 关注
原创 hash 实现源码
Hashtebl.h #ifndef _HASHTABLE_H #define _HASHTABLE_H /*********************************************************** * 数据类型定义
2012-10-22 22:07:33 320
转载 hash函数实现
Hash FunctionsA comprehensive collection of hash functions, a hash visualiser and some test results [see Mckenzie et al. Selecting a Hashing Algorithm, SP&E 20(2):209-224, Feb 1990] will be avai
2012-10-21 11:37:32 368
转载 python 解析网页数据的几种方法简介
工作中经常与数据打交道,去网上抓取数据也成了家常便饭。以前就准备抽空总结下的。最近刚好看到 http://segmentfault.com/q/1010000000124036 上这篇文章有人问到了,而且下面有热心pythoner 已经回答了,特此整理下,以备忘。问题:现在要抓取一批页面,并将指定标签里面的数据抓取出来,如何做到通用性好,稳定可用?1、使
2012-10-17 13:24:32 1079
转载 缓存 HTTP POST请求和响应
HTTP缓存的基本目的就是使应用执行的更快,更易扩展,但是HTTP缓存通常只适用于idempotent request(可以理解为查询请求,也就是不更新服务端数据的请求),这也就导致了在HTTP的世界里,一般都是对Get请求做缓存,Post请求很少有缓存。然而,我们有的时候也会遇到一些idempotent request并不能通过Get来实现的时候,例如,搜索API通常会需要很多的参数,尤
2012-10-17 12:58:35 2161
原创 最大子段和
问题表述 n个数(可能是负数)组成的序列a1,a2,…an.求该序列例如: 序列(-2,11,-4,13,-5,-2) ,最大子段和: 11 - 4 + 13=20。(1)穷举算法: O(n3), O(n2)(2)分治法:将序列a[1:n]从n/2处截成两段:a[1:n/2], a[n/2+1:n]实例三、最大子段和问题表述n个数(可能是负数)组成
2012-10-09 13:49:58 493
转载 海量数据处理——Bloom Filter
【什么是Bloom Filter】Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。
2012-10-06 13:56:49 280
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人