自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 在Hadoop上跑sql的数据工具

csdn的一则新闻,链接:http://www.csdn.net/article/2013-02-25/2814255-sql-is-next-for-hadoop。要点:下一代的SQL-on-Hadoop工具并不仅仅只是商业智能,也不是仅仅只能读取存储在Hadoop上数据的数据库产品, EMC Greenplum, HP Vertica, IBM Netezza, ParAccel, M

2013-10-30 16:15:59 1091

原创 结构化大数据的几种计算方法(二)

3、 SQL:这里是指完整的SQL/SP,即ANSI 2000或其超集。以Greenplum为例,GreenplumSQL计算能力强,开发效率高,性能高,这是它最大的优势。其他优势包括语言通用性强,学习成本低,维护简单、有一定的移植可能性。当然,它还有个绝招:支持存储过程,可以进行复杂的计算,因此可以方便地从大数据中获得商业价值。示例如下:CREATE OR REPLACE functionv

2013-10-28 08:30:10 1056

原创 结构化大数据计算的几种方法(一)

任何数据都要通过计算来产生价值才有意义,大数据也一样。结构化大数据的计算能力的高低决定了大数据的实用性。         我总结了几种常见的计算方法:API 、Script、SQL、类SQL。       1、  API:这是指没有使用JDBC或ODBC,而是自成体系的API访问方法。以MapReduce为例,MapReduce从底层就是以廉价并行计算为设计目标的,所以它的横向扩展性最好,

2013-10-25 14:14:24 2670

转载 SQL on Hadoop的最新进展及7项相关技术分享

早上看到csdn的更新,贴过来做个记号,原帖地址:http://www.csdn.net/article/2013-10-18/2817214-big-data-hadoop。自己编辑了一下,捡干货存档:Hive 目前Hive主要的改进(主要是体现在 Hive 0.11版本上):1. 同一条hive sql解析出的多个MR任务的合并。由Hive解析出来的

2013-10-23 09:24:24 1074

转载 大数据的理想应用模式

随着社会的信息化发展,企业IT化的不断完善,业务的不断扩展,服务质量的不断提高,企业数据越来越庞大:如何从海量数据中快速获取自己需要的数据?如何能够完成越来越复杂的数据计算?在数据仓库和数据库中的数据以TB\GB级增长的时候,如何能够保证数据查询和计算的高效率和响应度?这些问题都给CIO带来了严峻的挑战。针对上述的问题,包括Teradata、IBM、ORACLE、EMC、Apache基金会

2013-10-16 11:28:11 703

转载 大数据计算:结构化大数据计算的理想模式

随着社会的信息化发展,企业IT化的不断完善,业务的不断扩展,服务质量的不断提高,企业数据越来越庞大:如何从海量数据中快速获取自己需要的数据?如何能够完成越来越复杂的数据计算?在数据仓库和数据库中的数据以TB\GB级增长的时候,如何能够保证数据查询和计算的高效率和响应度?这些问题都给CIO带来了严峻的挑战。针对上述的问题,包括Teradata、IBM、ORACLE、EMC、Apache基金会

2013-10-16 11:16:55 882

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除