![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
个人总结
文章平均质量分 69
TriumPhSK
很忙!有事!请撒娇!!!
展开
-
维度建模 -- 星型模型和雪花模型的区别
雪花模型去除了冗余,设计复杂,可读性差,关联的维度表多,查询效率低,但是可扩展性好。星型模型冗余度高,设计简单,可读性高,关联的维度表少,查询效率高,可扩展性低。原创 2021-10-08 20:56:51 · 15206 阅读 · 1 评论 -
Hive -- 常用的字符串函数
Hive -- 常用的字符串函数原创 2021-07-20 18:05:55 · 635 阅读 · 0 评论 -
hive group by | distinct区别以及性能比较
select distinct a from t1;select a from t1 group by a;低版本hive执行计划:# distinctStage-Stage-1: Map: 396 Reduce: 1 Cumulative CPU: 7915.67 sec HDFS Read: 119072894175 HDFS Write: 10 SUCCESS# group byStage-Stage-1: Map: 396 Reduce: 457 Cumulative CPU: 1原创 2021-06-16 14:49:36 · 1911 阅读 · 0 评论 -
Hive -- 窗口分析函数
hive 日常用的窗口函数原创 2021-06-01 16:03:19 · 259 阅读 · 2 评论 -
Hive 日期时间操作
hive 时间日期操作原创 2020-12-01 18:12:55 · 14566 阅读 · 1 评论 -
count(1)、count(*)与count(列名)的执行区别
执行效果:1. count(1) and count(*)当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了!从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,count(1)会比count(*)的用时少些(1w以内数据量),不过差不了多少。如果count(1)是聚索引,id,那肯定是count(1)快。但是差的很小的。因为count(*),自动会优化指定到那一个字段。所以没必要去count(1),用c...原创 2020-09-01 22:51:43 · 233 阅读 · 0 评论 -
图解十大经典排序算法(Java)
面试中经常被问到的排序算法原创 2019-10-04 01:55:19 · 769 阅读 · 2 评论 -
CPU、缓存、内存、磁盘
CPU – 中央处理器CPU从存储器(内存Memory)或高速缓冲存储器(缓存Cache)中取出指令,放入指令寄存器,并对指令译码。它把指令分解成一系列的微操作,然后发出各种控制命令,执行微操作系列,从而完成一条指令的执行。内存(Memory)内存是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的。内存(Memory)也被称为内存储器和主存储器,其作用是用于暂时存放CPU...原创 2019-07-30 20:19:29 · 603 阅读 · 0 评论 -
Hive -- 经验总结
本人的工作hive使用经验的一些总结原创 2019-07-19 20:41:44 · 1706 阅读 · 1 评论 -
Hive优化
列裁剪设置参数 hive.optimize.cp=true在读取数据时,只读取查询中需要用到的列,而忽略其他列,例如:select a,b from t where e < 5;其中,对于表t包含的5个列(a,b,c,d,e),经过列裁剪,列c和d将会被忽略,执行中会只读取a,b,e列。分区裁剪...原创 2019-06-26 08:59:05 · 318 阅读 · 0 评论 -
Hive个人总结
什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序。1)Hive处理的数据存储在HDFS2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上Hive的优缺点优点操作接口...原创 2019-06-05 16:29:53 · 635 阅读 · 0 评论