- 博客(4)
- 问答 (1)
- 收藏
- 关注
原创 clickhouse入门使用
CLICKHOUSE文档1.clickhouse安装(单机版简化版)准备工作需要硬件:虚拟机(vmware,centos7)需要软件:安装包下载https://packagecloud.io/altinity/clickhouseclickhouse-client-20.1.8.41-1.el7.x86_64.rpmclickhouse-common-static-20.1.8.41-1.el7.x86_64.rpmclickhouse-server-20.1.8..
2020-07-13 09:31:39 1242
原创 HIVESQL优化方法
(这是我2年前总结的东西,当时是用华为Paas平台的大数据集群的时候,因为我们公司分配的资源较少,自己总结的部分优化方法,如有不足,望大家指正)1) set hive.map.aggr=true/false;当使用聚合函数时会在ma阶段进行聚合 效率更高同时消耗更多资源2) 当join表的时候有一个大表时用mapjoinselect /*+ mapjoin(a) */ a.ke...
2019-07-26 15:19:38 348
原创 关系型数据模型(库)中的键
在现在的关系型数据库中,存在着常用的几种键,举一个最常见的键: 主键,大家肯定都知道主键吧,现在我们要介绍关系型数据库中的4中键:超键、候选键、主键、外键1)超键:一个列或者列集,唯一标识表中的一条记录。超键可能包含用于唯一标识记录所不必要的额外的列,我们通常只对仅包含能够唯一标识记录的最小数量的列感兴趣。其实乍一看很难懂,其实是说法不太容易懂我们来弄一张表来说明一下stu...
2019-03-11 20:21:27 2005
原创 数仓表之三范式
没有规范化,数据的更新处理将变得困难,异常的插入、修改、删除数据的操作会频繁发生。我们先来看一下三范式的定义第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。第三范式(3NF):首先是 2NF,另外非主键列必须直接依...
2019-03-07 19:24:53 1612
空空如也
求HADOOP集群MAPREDUCE程序生成文件整合的办法
2017-08-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人