- 博客(2)
- 收藏
- 关注
原创 大数据过滤及判断算法 -- Bitmap / Bloomfilter
今天,有个同学向我咨询大数据的一些面试题,其中一类比较有代表性比如判断是否在集合内,比如10个url,判断一个url是否在集合内,还比如有个1~100万个连续无序数字,随机取出里面的N个,求这N个数字等等。这类问题都需要一个大的数据集合,而且每个数据单元都很小,比如一个int 。很大程度上,这类问题可以用Bitmap或者Bloomfilter来做,基本思想就是开辟一块大内存,然后利用一个byte里
2012-09-24 15:48:01 17869
原创 UtilBox(ub)基础组件 -- 并发任务队列Taskqueue/TaskDispatcher (一)
Task dispatcher, 任务分发队列,也可以叫做Taskqueue。之前好多同学看到这篇文章内容是“.....”,我是想做一个标记,想写这篇文章,但是没填内容,看的同学还挺多的,以为我是标题党,这里首先表示一下歉意。下次不会了哈。 1. Taskqueue模型简介 2. Taskqueue的用处和优势 3. Taskqueue
2012-09-04 17:46:57 2855
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人