hive
掌控自己就能掌控世界
这个作者很懒,什么都没留下…
展开
-
如何去实现hive离线分析脚本
总共分为3步:1.编写hql脚本简单案例:编写hql脚本:vim tongji1.hql内容如下:select * from fluxdb.tongji1 where reporttime='${statis_date}';很简单就是一个表查询,没啥逻辑保存退出后,记得 赋予执行权限:chmod +x tongji1.hql2.编写bash脚本statis_time=`date +%Y-%m-%d`/home/01/software/hive-1.2/bin/hive -d stati原创 2020-07-30 14:10:58 · 538 阅读 · 0 评论 -
hive常用参数配置设置
hive.exec.mode.local.auto决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行)truehive.exec.mode.local.auto.inputbytes.max如果 hive.exec.mode.local.auto 为 true,当输入文件大小小于此阈值时可以自动在本地模式运行,默认是 128兆。134217728Lhive.exec.mode.local.auto.tasks.max如果 hive.exec.mode.local.转载 2020-05-24 14:48:46 · 1013 阅读 · 0 评论 -
hive误删内部表如何恢复
测试删除hive内部分区表找回:删除前数据查看hive (default)> select * from test3 where statis_date='2020-05-17';OKclo1 clo2 clo3 clo4 statis_datezhangsan jiangsu lisi anhui 2020-05-17sunce dongwu daqiao dongwu 2020-05-17zhouyu dongwu xiaoqiao dongwu 2020-05-17wangwu原创 2020-05-18 23:03:33 · 2710 阅读 · 0 评论 -
hive行转列、列传行、侧视图使用案例
直接上干货!数据explode_lateral_view.txt:a:shandong,b:beijing,c:hebei|1,2,3,4,5,6,7,8,9|[{“source”:“7fresh”,“monthSales”:4900,“userCount”:1900,“score”:“9.9”},{“source”:“jd”,“monthSales”:2090,“userCount”:789...原创 2020-04-17 00:12:13 · 423 阅读 · 0 评论 -
hive表脏数据和null值处理方案
hive表脏数据情况及解决方案:1.制表分隔符和数据列分割符不一致案例:本地文件导入hive表出现查询数值为null值本地导入数据入hive表sql:hive> load data local inpath "/home/01/temp/employee.txt" overwrite into table employee;Loading data to table emp.emp...原创 2020-04-16 21:45:34 · 1569 阅读 · 0 评论 -
明明新建了个mysql的数据库,但是当你往这个数据库里的表里插入数据时,却提示找不到这个数据库
下面的fluxdb是我新建的数据库mysql> show databases;+--------------------+| Database |+--------------------+| information_schema || fluxdb || hive || mysql ...原创 2020-03-26 20:03:24 · 2235 阅读 · 0 评论 -
hive设置map和reduce数量,可参考
hive的map和reduce数量如何确定map的数量确定map的数量:主要决定因素有input文件的总个数,input中文件的大小,集群设置的 文件块大小(默认128M,可在hive shell中通过set dfs.block.size查看)三种举例:文件不足128M则当做一个块,大于128M则拆分 input目录下有七个文件,大小均为64M,则共7个mapinput目录下有...转载 2020-03-13 11:12:38 · 2751 阅读 · 0 评论 -
Hive参数设置及优化
Hive参数设置及优化:1.动静态分区属性设置2.Set hive.map.aggr=true 通过设置属性hive.map.aggr值为true来提高聚合的性能,这个设置会触发在map阶段进行的‘顶级’聚合过程。(非顶级的聚合过程会在执行一个GROUP BY后进行。)不过,这个设置需要更多的内存3.本地模式设置大多数情况下查询都会触发一个MapReduce任务(job),hive中某些...原创 2020-03-10 22:27:14 · 3888 阅读 · 0 评论 -
HIVE使用insert into插入中文数据乱码
hive中文数据乱码hive中直接使用insert into table value插入中文数据会导致乱码问题。sql语句如下insert into mac_dict partition(create_time_p='20190616') values ('1','F2-DB-E2-BE-69-F7','余金科','70211134','true','余金科','2','1559808057'...转载 2020-01-07 23:01:38 · 5011 阅读 · 1 评论
分享