hive的特性
Hive不是一个完整的数据库。
Hadoop和hdfs的局限性通常也掣肘着hive。
Hive 不提供记录级别的update, insert, delete,需要join的方式来变相达到。
由于hadoop是面向批处理的系统,所以hive查询存在高延迟。
hive是对熟悉sql的开发者来说是友好型的。
所有的命令和查询都将流向Driver,Driver的作用是编译输入值,优化计算,执行必要的步骤,类似MapReduce任务。
当产生MapReduce任务,hive不产生类似于java的mapReduce代码,相反的,它使用由内嵌的原生的由xml文件驱动的Mapper和Reducer模块,换句话说,这些模块函数就是将计算任务编码成xml格式的“翻译官”。
hive cli命令行
$ hive --help --service cli usage: hive
-d,--define <key=value>
-e <quoted-query-string> -f <filename>
-H,--help
-h <hostname>
--hiveconf <property=value> --hivevar <key=value>
-i <filename> -p <port> -S,--