2013年10月_刨坑数据

原创在Hadoop上跑sql的数据工具

csdn的一则新闻，链接：http://www.csdn.net/article/2013-02-25/2814255-sql-is-next-for-hadoop。要点：下一代的SQL-on-Hadoop工具并不仅仅只是商业智能，也不是仅仅只能读取存储在Hadoop上数据的数据库产品， EMC Greenplum, HP Vertica, IBM Netezza, ParAccel, M

2013-10-30 16:15:59 1091

原创结构化大数据的几种计算方法（二）

3、 SQL：这里是指完整的SQL/SP，即ANSI 2000或其超集。以Greenplum为例,GreenplumSQL计算能力强，开发效率高，性能高，这是它最大的优势。其他优势包括语言通用性强，学习成本低，维护简单、有一定的移植可能性。当然，它还有个绝招：支持存储过程，可以进行复杂的计算，因此可以方便地从大数据中获得商业价值。示例如下：CREATE OR REPLACE functionv

2013-10-28 08:30:10 1056

原创结构化大数据计算的几种方法（一）

任何数据都要通过计算来产生价值才有意义，大数据也一样。结构化大数据的计算能力的高低决定了大数据的实用性。我总结了几种常见的计算方法：API 、Script、SQL、类SQL。 1、 API：这是指没有使用JDBC或ODBC，而是自成体系的API访问方法。以MapReduce为例，MapReduce从底层就是以廉价并行计算为设计目标的，所以它的横向扩展性最好，

2013-10-25 14:14:24 2670

转载 SQL on Hadoop的最新进展及7项相关技术分享

早上看到csdn的更新，贴过来做个记号，原帖地址：http://www.csdn.net/article/2013-10-18/2817214-big-data-hadoop。自己编辑了一下，捡干货存档：Hive 目前Hive主要的改进(主要是体现在 Hive 0.11版本上)：1. 同一条hive sql解析出的多个MR任务的合并。由Hive解析出来的

2013-10-23 09:24:24 1074

转载大数据的理想应用模式

随着社会的信息化发展，企业IT化的不断完善，业务的不断扩展，服务质量的不断提高，企业数据越来越庞大：如何从海量数据中快速获取自己需要的数据？如何能够完成越来越复杂的数据计算？在数据仓库和数据库中的数据以TB\GB级增长的时候，如何能够保证数据查询和计算的高效率和响应度？这些问题都给CIO带来了严峻的挑战。针对上述的问题，包括Teradata、IBM、ORACLE、EMC、Apache基金会

2013-10-16 11:28:11 703

转载大数据计算：结构化大数据计算的理想模式

随着社会的信息化发展，企业IT化的不断完善，业务的不断扩展，服务质量的不断提高，企业数据越来越庞大：如何从海量数据中快速获取自己需要的数据？如何能够完成越来越复杂的数据计算？在数据仓库和数据库中的数据以TB\GB级增长的时候，如何能够保证数据查询和计算的高效率和响应度？这些问题都给CIO带来了严峻的挑战。针对上述的问题，包括Teradata、IBM、ORACLE、EMC、Apache基金会

2013-10-16 11:16:55 882

u012388497的专栏

原创在Hadoop上跑sql的数据工具

原创结构化大数据的几种计算方法（二）

原创结构化大数据计算的几种方法（一）

转载 SQL on Hadoop的最新进展及7项相关技术分享

转载大数据的理想应用模式

转载大数据计算：结构化大数据计算的理想模式

空空如也

空空如也

原创 在Hadoop上跑sql的数据工具

原创 结构化大数据的几种计算方法（二）

原创 结构化大数据计算的几种方法（一）

转载 SQL on Hadoop的最新进展及7项相关技术分享

转载 大数据的理想应用模式

转载 大数据计算：结构化大数据计算的理想模式

空空如也

空空如也

原创在Hadoop上跑sql的数据工具

原创结构化大数据的几种计算方法（二）

原创结构化大数据计算的几种方法（一）

转载大数据的理想应用模式

转载大数据计算：结构化大数据计算的理想模式