cda 1级模拟题错题知识点总结

Sql

truncate函数

格式:TRUNCATE(number, decimals)
number: the number to be truncated
decimals:the number of decimal places to truncate to 截断到的小数位数,如果为0则表示不保留小数
例如:
select truncate(2.83,0)
结果为2
select truncate(2.83,1)
结果为2.8
select truncate(2.83,2)
结果为2.83

SKU和SPU

概念

SPU = standard product unit (SPU) is the smallest unit of commodity information aggregation.标准化产品单位(spu)
SKU = stock keeping unit 库存保管单位

例如:如果联想电脑是SPU,那么联想G50-16G就是SKU
在这里插入图片描述
在这里插入图片描述

如何使用簇状柱形图制作水滴图

【水滴图是什么鬼,能用簇状柱形图制作出来??】 https://www.bilibili.com/video/BV1na4y1g7Hg/?share_source=copy_web&vd_source=7bb833164ffff331416eb9ad96d824bd
内容主要来自youtube的大哥:
https://www.youtube.com/watch?v=fhMLFQIl8Eg

桑基图

在这里插入图片描述

列联相关系数【未完成】

进行t检验之前,需要先进行F检验,判断两个总体的方差是否存在显著差异【为什么?】【未完成】

在这里插入图片描述

在这里插入图片描述

箱线图/盒须图

案例引入:
已知一组数据为4、4、6、7、10、11、12、14、15。
则中位数是10
上四分位数是(12+14)/2=13
下四分位数是(4+6)/2=5
对应的箱线图长这样:
在这里插入图片描述
现在再引入另一组数据:5、5、7、8、10、11、12、14、15
在这里插入图片描述

通过该例子可以看出:
1.案例中中位数更接近上四分位数Q3,结合数据发现,后50%的数据分布更为集中
2.第二组数据更为集中(从5开始),此时发现箱线图的箱体更短。这个所谓的短可以通过四分位差IQR来判断,所以四分位差越小,数据越集中。有的书上的结论是:四分位差描述了中间50%的数据的集中程度。

顺序数据为什么能用四分位差来度量数据?

第三章数据库应用

子查询

在这里插入图片描述

#为什么是1.5IQR来识别异常值?
找到一篇不错的文章:详细内容请点文章
Why “1.5” in IQR Method of Outlier Detection?
https://towardsdatascience.com/why-1-5-in-iqr-method-of-outlier-detection-5d07fdc82097
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值