- 博客(3)
- 资源 (1)
- 收藏
- 关注
转载 Google处理1TB数据只需68秒1PB六个小时
如何高效处理全球信息一直是Google的狂热追求,而其自行开发的C++编程工具MapReduce就在其中扮演着关键角色。它可以多线程同时执行大规模数据集(1TB以上)的并行运算,是日常超大计算量的完美方案。 Google今天自豪地宣布,他们只需要短短68秒钟就能完成对1TB数据的排序处理。这些数据都是未压缩的文本文件,使用Google File System文件系统存储在1000台计算机上
2008-11-25 19:56:00 1194
转载 从Larbin看互联网爬虫设计
转载:http://blog.ifeng.com/article/121656.html互联网是一个庞大的非结构化的数据库,将数据有效的检索并组织呈现出来有着巨大的应用前景,尤其是类似RSS的以XML为基础的结构化的数据越来越多,内容的组织方式越来越灵活,检索组织并呈现会有着越来越广泛的应用范围,同时在时效性和可读性上也会有越来越高的要求。这一切的基础是爬虫,信息的来源入口。一个高
2008-11-14 10:28:00 806 1
原创 17位字符号码的计算
朋友的一个问题: 给定一个字符,字符的长度为17个,存最大长度为17的号码,现要求将这个号码进行加1,如何进行操作?由于int型最大只能存4294967296 ,才10位数字,因此不能使用int,而double占8个字节,可以最大保存最大数为18446744073709551616,因此方法如下:方法一、用double类型存储 char szContNo[17+1]; strcpy(szCo
2008-11-10 17:11:00 1199
O'Reilly radius
2012-01-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人