Sql
truncate函数
格式:TRUNCATE(number, decimals)
number: the number to be truncated
decimals:the number of decimal places to truncate to 截断到的小数位数,如果为0则表示不保留小数
例如:
select truncate(2.83,0)
结果为2
select truncate(2.83,1)
结果为2.8
select truncate(2.83,2)
结果为2.83
SKU和SPU
概念
SPU = standard product unit (SPU) is the smallest unit of commodity information aggregation.标准化产品单位(spu)
SKU = stock keeping unit 库存保管单位
例如:如果联想电脑是SPU,那么联想G50-16G就是SKU
如何使用簇状柱形图制作水滴图
【水滴图是什么鬼,能用簇状柱形图制作出来??】 https://www.bilibili.com/video/BV1na4y1g7Hg/?share_source=copy_web&vd_source=7bb833164ffff331416eb9ad96d824bd
内容主要来自youtube的大哥:
https://www.youtube.com/watch?v=fhMLFQIl8Eg
桑基图
列联相关系数【未完成】
进行t检验之前,需要先进行F检验,判断两个总体的方差是否存在显著差异【为什么?】【未完成】
箱线图/盒须图
案例引入:
已知一组数据为4、4、6、7、10、11、12、14、15。
则中位数是10
上四分位数是(12+14)/2=13
下四分位数是(4+6)/2=5
对应的箱线图长这样:
现在再引入另一组数据:5、5、7、8、10、11、12、14、15
通过该例子可以看出:
1.案例中中位数更接近上四分位数Q3,结合数据发现,后50%的数据分布更为集中
2.第二组数据更为集中(从5开始),此时发现箱线图的箱体更短。这个所谓的短可以通过四分位差IQR来判断,所以四分位差越小,数据越集中。有的书上的结论是:四分位差描述了中间50%的数据的集中程度。
顺序数据为什么能用四分位差来度量数据?
第三章数据库应用
子查询
#为什么是1.5IQR来识别异常值?
找到一篇不错的文章:详细内容请点文章
Why “1.5” in IQR Method of Outlier Detection?
https://towardsdatascience.com/why-1-5-in-iqr-method-of-outlier-detection-5d07fdc82097