Big Data
文章平均质量分 61
sony315
这个作者很懒,什么都没留下…
展开
-
云计算时代:当大数据遇到敏捷
http://cloud.csdn.net/a/20111010/305493.html今年九月在纽约的O’Reilly媒体会议上大数据技术有两大呼声:企业级和敏捷。我们知道企业级的商务智能产品有Oracle Hyperion、SAP BusinessObjects和转载 2011-10-11 01:07:09 · 914 阅读 · 0 评论 -
系统架构师大会
http://sacc.it168.com/2.html演讲主题:大规模社区网站设计经验 内容概要:如何实现支撑数十亿的流量的社区架构?如何保证产品7*24小时的不间断服务?如何处理百亿量级数据的原创 2011-10-16 10:13:37 · 5554 阅读 · 1 评论 -
WEKA
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视原创 2011-10-16 10:59:34 · 675 阅读 · 0 评论 -
MongoDB vs Cassandra
http://blog.boxedice.com/2011/07/21/mongodb-vs-cassandra/Real software developmentHomeAboutMongoDBMongoDB MonitoringStartups转载 2011-10-19 01:44:12 · 2268 阅读 · 0 评论 -
Mongodb Mapreduce 初窥
http://cloud.csdn.net/a/20110322/294395.html作者声明:本文是学习Mongodb过程中的副产品,因为接触时间并不长,难免有理解上的偏差,希望借此文与感兴趣的朋友讨论切磋,呵呵。去年年底,开始接触并学习Mapreduce模型。因转载 2011-10-18 08:23:52 · 528 阅读 · 0 评论 -
HBase性能深度分析
http://www.programmer.com.cn/7246/文/刘星HBase作为BigTable的一个开源实现,随着其应用的普及,用户对它的性能数据愈发关注。本文将为您揭开HBase性能测试的一角,邀您一起参与到对云计算模块性能调优的深度思考中。对于转载 2011-10-18 08:31:40 · 664 阅读 · 0 评论 -
MapReduce Hold不住?
http://www.programmer.com.cn/8606/本文系统地介绍和分析比较了业界主流的Yahoo! S4、StreamBase和Borealis三种流式计算系统,希望读者能从这些系统的设计中领悟到不同场景下流式计算所要解决的关键问题。背景非实时计转载 2011-10-18 08:18:39 · 430 阅读 · 0 评论 -
在两三年前,选择数据库是一件非常容易的事。资金充足的企业会选择甲骨文数据库,使用微软产品的企业通常SQL Server,而预算不足企业则会选择MySQL。不过,如今的情况已经大不相同了。 最近两三年
http://cloud.csdn.net/a/20110808/302768.html在两三年前,选择数据库是一件非常容易的事。资金充足的企业会选择甲骨文数据库,使用微软产品的企业通常SQL Server,而预算不足企业则会选择MySQL。不过,如今的情转载 2011-10-18 08:30:36 · 3308 阅读 · 0 评论 -
四款有名的开源海量数据采集工具
http://hi.baidu.com/nullbeta/blog/item/76e2781549d76e1d34fa418f.html四款有名的开源海量数据采集工具2011-08-01 23:21面对海量数据,传统的ETL(Extraction-转载 2011-10-11 05:32:26 · 10090 阅读 · 0 评论 -
Three different implementations of MapReduce
http://www.dbms2.com/2008/09/05/three-different-implementations-of-mapreduce/So far as I can see, there are three implementations转载 2011-10-11 08:40:08 · 460 阅读 · 0 评论 -
Apache Avro 与 Thrift 比较
http://www.tbdata.org/archives/1307pache Avro 与 Thrift 比较Avro和Thrift都是跨语言,基于二进制的高性能的通讯中间件. 它们都提供了数据序列化的功能和RPC服务. 总体功能上类似,但是哲学不一样转载 2011-10-19 11:57:24 · 24937 阅读 · 2 评论 -
HTML5和Flash——如何选择合适的工具
HTML5和Flash——如何选择合适的工具2011-10-18 14:25 | 2281次阅读 | 来源:eweek 【已有11条评论】发表评论关键词:HTML5,Flash |作者:Darryl K. Taft | 收藏这篇资讯Adobe系统公司日前透露了一些旗舰Flash平台的信息:能让开发人员同时使用HTML5建立丰富的应用。Adobe官方想澄清一件事:转载 2011-10-20 10:12:10 · 843 阅读 · 0 评论 -
Hive vs. Pig
http://www.larsgeorge.com/2009/10/hive-vs-pig.htmlHive vs. PigWhile I was looking atHive and Pig for processing large amounts of data without the need to write MapReduce code I found tha转载 2012-01-04 01:23:24 · 1605 阅读 · 0 评论 -
云计算与GigaSpaces
一、什么是云计算? 根据NIST(National Institute of Standards and Technology)的定义,云计算[1]是: Cloud computing is a model for enabling convenient,转载 2011-10-13 23:14:47 · 580 阅读 · 0 评论 -
SAP HANA-迅捷企业之选
作者名称:Alex Liu原文地址:http://liualex.com/archives/18401. 从废话开始2. SAP HANA快熟介绍3. 关于内存数据库4. 不一样的架构,深入了解一下吧5. 基于HANA的应用,HANA Store?6.原创 2011-10-12 22:39:10 · 684 阅读 · 0 评论 -
HBase vs Cassandra: 我们迁移系统的原因
原文: http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/ 原作者:Dominic Williams 原文发布日期:February 24, 2010 at 7:27 pm转载 2011-10-13 11:47:30 · 788 阅读 · 0 评论 -
NoSQL数据库对比:MongoDB vs.Cassandra
这不算是一篇PK文章,当然对于任意一个产品,没有绝对的主场,所以文章内容更多是从各个方面的对比。本文来自boxedice的技术博客,在写此文时他们已经在Server Density中使用MongoDB两年多时间了。全文分为两部分,技术方面和市场运作方面。 技术方面转载 2011-10-11 06:59:59 · 4308 阅读 · 0 评论 -
从Hadoop框架与MapReduce模式中谈海量数据处理
从Hadoop框架与MapReduce模式中谈海量数据处理 从hadoop框架与MapReduce模式中谈海量数据处理前言 几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个转载 2011-10-11 12:58:52 · 458 阅读 · 0 评论 -
Big Data Application Platform
http://natishalom.typepad.com/nati_shaloms_blog/2011/09/big-data-application-platform.htmlBig Data Application PlatformIt's time to th转载 2011-10-12 13:18:29 · 2369 阅读 · 0 评论 -
在VMWare Workstation上使用RedHat Linux安装和配置Hadoop群集环境01_虚拟机的安装
在VMWare Workstation上使用RedHat Linux安装和配置Hadoop群集环境01_虚拟机的安装 整个Hadoop环境搭建过程用到了三个虚拟机:Red Hat Linux1、Red Hat Linux2、Red Hat Linux3,其IP地址分别为转载 2011-10-12 10:34:02 · 1046 阅读 · 0 评论 -
Hadoop Futures at Structure Big Data: DataStax Brisk, EMC, and MapR
he Structure Big Data conference was filled with news and rumors of newHadoop offerings. During a MapReduce panel DataStaxannounced Bris转载 2011-10-13 13:17:35 · 626 阅读 · 0 评论 -
An Introduction to Data Mining
http://chem-eng.utoronto.ca/~datamining/dmc/data_mining_map.htmCopyright © 2010-2011, Dr. Saed Sayad An Introd转载 2011-10-14 03:43:28 · 535 阅读 · 0 评论 -
TB,PB, Eb, Zb, YB
存储容量:是该存储设备上可以存储数据的最大数量,通常使用千字节(kb kilobyte)、兆字节(MB megabyte)、吉字节(GB, gigabyte)、太字节(TB ,terabyte)和PB(Petabyte)、EB(Exabyte)等来衡量。 1KB=2(10)B=转载 2011-10-12 22:29:03 · 5566 阅读 · 0 评论 -
CassandraSF2011: Progress and Futures
En | 中文 |日本語 | Br634,980 Sep unique visitors Tracking change and innovation in the enterprise software development community转载 2011-10-13 12:49:16 · 1156 阅读 · 0 评论 -
The Top 10 Reasons SAP HANA Is Disrupting Larry Ellison's Grand Plans
http://www.forbes.com/sites/sap/2011/06/23/the-top-10-reasons-sap-hana-is-disrupting-larry-ellisons-grand-plans/Oracle has said that转载 2011-10-12 22:51:17 · 1051 阅读 · 0 评论 -
架构学习笔记—Amazon
架构学习笔记—Amazon分类: 架构设计 2011-10-11 08:42 1535人阅读 评论(3)收藏 举报谁也没想到,之前一个小小的网上书店,现在居然成了全球商品品种最多的网上零售商和全球第2大互联网公司,它叫Amazon。相信很多转载 2011-10-12 22:53:07 · 429 阅读 · 0 评论 -
hadoop wordcount source code analysis
http://radarradar.iteye.com/blog/289261再看一下Reduce的实现:Java代码 /** * Reduce是一个内部静态类。作为统计单词数量的中间结果类,由于这个例子简单无须执行中间结果的合并。转载 2011-10-13 07:47:52 · 1022 阅读 · 0 评论 -
hbase and cassadra 比较
CassandraHBase一致性Quorum NRW策略通过Gossip协议同步Merkle Tree,维护集群节点间的数据一致性单节点,无复制,强一致性可用性1,基于Consistent Hash相邻节点复制数据,数据存在于多个转载 2011-10-13 11:04:11 · 1361 阅读 · 0 评论 -
Pig and Hive at Yahoo!
http://developer.yahoo.com/blogs/hadoop/posts/2010/08/pig_and_hive_at_yahoo/Pig and Hive at Yahoo!Yahoo! has begun evaluating Hive for use as part of its Hadoop stack. Since, in many peoples转载 2012-01-04 01:25:37 · 964 阅读 · 0 评论