Hive
Janvn
这个作者很懒,什么都没留下…
展开
-
Hive中常被忽视的利器——宏
我们都知道Hive中有UDF(user defined function)——即用户自定义函数,但是由于UDF是Java编写的,代码中堆变量的内存回收完全不受开发者控制,而UDF程序又是嵌套在Hive SQL中执行的,对规模较大的表,就往往会出现由于UDF内存回收不及时造成的out-of-memory错误。因此,在生产环境中,UDF是严格受限的。那么,怎么办呢? 幸好,大多数情况下我们并不是真正需要(不得不用)UDF,大多数时候我们仅仅只是需要把一些虽然繁琐但其实结构简单的逻辑封装起来以便重复使用。举个栗转载 2020-10-15 10:30:51 · 347 阅读 · 0 评论 -
How HiveServer2 Brings Security and Concurrency to Apache Hive
一篇比较老的文章。 repost:https://blog.cloudera.com/how-hiveserver2-brings-security-and-concurrency-to-apache-hive/ Apache Hivewas one of the first projects to bring higher-level languages to Apache Hadoop. Specifically, Hive enables the legions of trained SQL u.转载 2020-10-09 20:11:57 · 272 阅读 · 0 评论 -
在 Apache Hive 中轻松生存的12个技巧
Hive 可以让你在 Hadoop 上使用 SQL,但是在分布式系统上优化 SQL 则有所不同。这里是让你可以轻松驾驭 Hive 的12个技巧。 Hive 并不是关系型数据库(RDBMS),但是它大多数时候都表现得像是一个关系型数据库一样,它有表、可以运行 SQL、也支持 JDBC 和 ODBC。 这种表现既有好的一面,也有不好的一面:Hive 并不像关系型数据库那样执行 SQL 查询。我在 Hi...转载 2020-03-11 23:45:10 · 191 阅读 · 0 评论