- 博客(2)
- 资源 (6)
- 收藏
- 关注
转载 Hadoop/Hive简介 1
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。Hadoop是一个存储计算框架,主要由两部分组成: 1,存储(Hado
2014-10-20 21:16:18 683
转载 HBase 简介-1
单台设备的性能、资源、可扩展性等限制 —— 分布式系统(Hadoop)传统关系型数据库在面对海量数据时的乏力 —— 分布式数据库(HBase)关系型数据库,顾名思义,善于处理数据模型间复杂的关系、逻辑、事务。但在处理海量数据时速度、并发量、可扩展性却惨不忍睹。当然,我们可以通过巧妙的设计与二次开发来解决上述问题。速度:分表(减少单表数据量)、缓存查询、静态预生成、提高硬件性能。
2014-10-20 20:43:05 591
Java正则表达式入门
2010-07-03
java 正则表达式
2010-07-03
关于男女大学生的爱情观和婚姻观异同调查报告
2010-04-19
生产者消费者问题代码
2009-12-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人