wxx8448891-CSDN博客

原创动态规划问题

0-1背包最小乘积（大）

2010-03-16 16:08:00 224

原创任意进制相互转换

模拟除法

2010-03-16 16:06:00 287

原创海量数据处理方法总结

最近有点忙，稍微空闲下来，发篇总结贴。大数据量的问题是很多面试笔试中经常出现的问题，比如baidu google 腾讯这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结，当然这些方法可能并不能完全覆盖所有的问题，但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目，方法不一定最优，如果你有更好的处理

2010-03-16 16:04:00 522

转载海量数据处理---题目

问题实例：给你A,B两个文件，各存放50亿条URL，每条URL占用64字节，内存限制是4G，让你找出A,B文件共同的URL。如果是三个乃至n个文件呢？根据这个问题我们来计算下内存的占用，4G=2^32大概是40亿*8大概是340亿，n=50亿，如果按出错率0.01算需要的大概是650亿个bit。现在可用的是340亿，相差并不多，这样可能会使出错率上升些。另外如果这些urlip是一一对应的，

2010-03-16 16:00:00 1139

原创搜索技术

通用垂直全文目录索引元搜索原理网络爬虫，数据库索引，分词匹配

2010-03-16 15:58:00 255

原创进阶

算法 UNIX/LINUX Socket 多线程 Shell Python

2010-03-16 15:57:00 217

原创基础知识

C语言C++数据结构网络操作系统数据库

2010-03-16 15:55:00 244

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人