最容易出错的 Hive Sql 详解

本文详细介绍了在使用Hive SQL过程中常见的错误点,包括decimal类型定义、location指定、load data操作、drop与truncate的区别、join类型及其注意事项、left semi join的特殊性、聚合函数与null值处理、运算符中的null值问题以及and与or的优先级。通过这些解析,帮助读者避免在数据分析和数仓搭建时犯错。
摘要由CSDN通过智能技术生成

前言

在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的几大主流框架全部都支持sql语法,包括 hive,spark,flink等,所以sql在大数据领域有着不可替代的作用,需要我们重点掌握。

在使用sql时如果不熟悉或不仔细,那么在进行查询分析时极容易出错,接下来我们就来看下几个容易出错的sql语句及使用注意事项。

正文开始

1. decimal

hive 除了支持 int,double,string等常用类型,也支持 decimal 类型,用于在数据库中存储精确的数值,常用在表示金额的字段上

注意事项:

如:decimal(11,2) 代表最多有11位数字,其中后2位是小数,整数部分是9位; 
如果整数部分超过9位,则这个字段就会变成null,如果整数部分不超过9位,则原字段显示; 
如果小数部分不足2位,则后面用0补齐两位,如果小数部分超过两位,则超出部分四舍五入; 
也可直接写 decimal,后面不指定位数,默认是 decimal(10,0) 整数10位,没有小数

2. location

表创建的时候可以用 location 指定一个文件或者文件夹
create  table stu(id int ,name string)  location '/user/stu2';

注意事项:

创建表时使用location,<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吾爱大数据

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值