云计算
大林-Java
专注于互联网技术IT,Java架构,数据库及数据仓库,缓存,消息,分布式,大数据
展开
-
云计算之现状
早期grid computing 网格计算分布式计算 Oracle Grid,coluding computing云计算 网格计算与云计算区别:网格:需要计算能力很强计算机,紧耦合 云算计:廉价PC即可,松耦合虚拟化:把以一台计算能力很强服务器虚拟化很多服务器,供用户使用。CloudStack vs OpenStack三种云计算平台:1:IaaS:把基原创 2014-02-17 21:08:37 · 826 阅读 · 0 评论 -
海量数据去重策略
摘要:随着收集到数据体积的激增,去重无疑成为众多大数据玩家面对的问题之一。重复数据删除在减少存储、降低网络带宽方面有着显著的优势,并对扩展性有所帮助。在存储架构中,删除重复数据的常用方法包括哈希、二进制比较和增量差分;而本文专注的是使用MapReduce和HDFS对数据进行去重。随着存储数据信息量的飞速增长,越来越多的人开始关注存储数据的缩减方法。数据压缩、单实例存储和重复数据删除等都转载 2014-03-13 14:46:28 · 6364 阅读 · 0 评论