维度建模 -- 星型模型和雪花模型的区别 雪花模型去除了冗余,设计复杂,可读性差,关联的维度表多,查询效率低,但是可扩展性好。星型模型冗余度高,设计简单,可读性高,关联的维度表少,查询效率高,可扩展性低。
Hive中运行任务报错:Error during job, obtaining debugging information... running beyond physical memory limitsError during job, obtaining debugging information
hive group by | distinct区别以及性能比较 select distinct a from t1;select a from t1 group by a;低版本hive执行计划:# distinctStage-Stage-1: Map: 396 Reduce: 1 Cumulative CPU: 7915.67 sec HDFS Read: 119072894175 HDFS Write: 10 SUCCESS# group byStage-Stage-1: Map: 396 Reduce: 457 Cumulative CPU: 1
nohup sh xxx.sh >/dev/null 2>&1 & nohup sh xxx.sh >/dev/null 2>&1 &进程xxx永久的在后台执行,并将标准输出和标准错误流重定向到linux的空设备&: 后台运行,当遇到退出当前shell终端时,后台运行的任务就会终止。因为运行xxx.sh进程的父进程是当前shell终端进程,关闭当前shell终端时,父进程退出,会发送hangup信号给所有子进程,子进程收到hangup以后也会退出。所以要想退出当前shell终端时xxx.sh继续运行,则需要使用nohup忽略hang
python脚本里面运行shell命令的方法 python脚本里面运行shell命令subprocesssubprocess 模块允许我们启动一个新进程,并连接到它们的输入/输出/错误管道,从而获取返回值。subprocess.call()
Hive问题汇总 1、Failed with exception java.io.IOException:java.lang.RuntimeException: ORC split generation failed with exception: java.lang.ArrayIndexOutOfBoundsException: 6原因是低版本的hive不能读取高版本hive的orc格式的文件
Flink问题汇总 1、Caused by: java.util.concurrent.CompletionException: org.apache.flink.runtime.messages.FlinkJobNotFoundException: Could not find Flink job找不到job,flink假死重启下服务