- 博客(5)
- 资源 (10)
- 收藏
- 关注
转载 HIVE 调优方法大全
Hive是目前应用最多最广的SQL on Hadoop工具,近期很多专业的大数据公司推出了很多新的,基于列式或者内存热数据的SQL工具,像Impala,Tez,Spark等等,但是Hive仍然是目前使用率最高和普及面最广的SQL on Hadoop的工具。在以前淘宝罗李的报告中,淘宝90%的业务跑在Hive上面。暴风影音的比例更高一些,大概95%以上都是跑在Hive上面。尽管很多人对Hive有看法
2015-10-16 16:29:24 1950
转载 hive中order by,sort by, distribute by, cluster by作用以及用法
====================================marked by Alan at 2015-10-15 13:52=========================================1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有h
2015-10-16 13:53:00 416
转载 Hive sql语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言
2015-10-15 14:15:49 493
原创 hadoop2.0单机部署(配置文件)
=====================================================主要配置一下几个配置文件=====================================================1.core-site.xml fs.default.name hdfs://YARN001:8020
2015-10-09 14:30:49 461
原创 HIVE函数
1、日期函数返回值类型 名称 描述 string from_unixtime(int unixtime) 将时间戳(unix epoch秒数)转换为日期时间字符串,例如from_unixtime(0)="1970-01-01 00:00:00" bigint unix_tim
2015-10-09 11:08:57 517
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人