- 博客(6)
- 收藏
- 关注
原创 在Hadoop上跑sql的数据工具
csdn的一则新闻,链接:http://www.csdn.net/article/2013-02-25/2814255-sql-is-next-for-hadoop。要点:下一代的SQL-on-Hadoop工具并不仅仅只是商业智能,也不是仅仅只能读取存储在Hadoop上数据的数据库产品, EMC Greenplum, HP Vertica, IBM Netezza, ParAccel, M
2013-10-30 16:15:59 1091
原创 结构化大数据的几种计算方法(二)
3、 SQL:这里是指完整的SQL/SP,即ANSI 2000或其超集。以Greenplum为例,GreenplumSQL计算能力强,开发效率高,性能高,这是它最大的优势。其他优势包括语言通用性强,学习成本低,维护简单、有一定的移植可能性。当然,它还有个绝招:支持存储过程,可以进行复杂的计算,因此可以方便地从大数据中获得商业价值。示例如下:CREATE OR REPLACE functionv
2013-10-28 08:30:10 1056
原创 结构化大数据计算的几种方法(一)
任何数据都要通过计算来产生价值才有意义,大数据也一样。结构化大数据的计算能力的高低决定了大数据的实用性。 我总结了几种常见的计算方法:API 、Script、SQL、类SQL。 1、 API:这是指没有使用JDBC或ODBC,而是自成体系的API访问方法。以MapReduce为例,MapReduce从底层就是以廉价并行计算为设计目标的,所以它的横向扩展性最好,
2013-10-25 14:14:24 2670
转载 SQL on Hadoop的最新进展及7项相关技术分享
早上看到csdn的更新,贴过来做个记号,原帖地址:http://www.csdn.net/article/2013-10-18/2817214-big-data-hadoop。自己编辑了一下,捡干货存档:Hive 目前Hive主要的改进(主要是体现在 Hive 0.11版本上):1. 同一条hive sql解析出的多个MR任务的合并。由Hive解析出来的
2013-10-23 09:24:24 1074
转载 大数据的理想应用模式
随着社会的信息化发展,企业IT化的不断完善,业务的不断扩展,服务质量的不断提高,企业数据越来越庞大:如何从海量数据中快速获取自己需要的数据?如何能够完成越来越复杂的数据计算?在数据仓库和数据库中的数据以TB\GB级增长的时候,如何能够保证数据查询和计算的高效率和响应度?这些问题都给CIO带来了严峻的挑战。针对上述的问题,包括Teradata、IBM、ORACLE、EMC、Apache基金会
2013-10-16 11:28:11 703
转载 大数据计算:结构化大数据计算的理想模式
随着社会的信息化发展,企业IT化的不断完善,业务的不断扩展,服务质量的不断提高,企业数据越来越庞大:如何从海量数据中快速获取自己需要的数据?如何能够完成越来越复杂的数据计算?在数据仓库和数据库中的数据以TB\GB级增长的时候,如何能够保证数据查询和计算的高效率和响应度?这些问题都给CIO带来了严峻的挑战。针对上述的问题,包括Teradata、IBM、ORACLE、EMC、Apache基金会
2013-10-16 11:16:55 882
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人