数据挖掘(1)
拿起数据挖掘的数,翻看几页,我擦,这是啥?苦涩难懂。那咋办?不研究心里过不去啊,硬着头皮上,深呼吸,come on!除了作者拽了几个让小白发蒙的名词,发现还是可以捋出一条能走下去的线路,整理在此,与各位共勉!
数据仓库
已经做完实时数仓的项目,回头看数仓,才有点感觉。原来数仓就是数据仓库的意思啊。。。(一个自认为很聪明的傻子的内心独白)
数据立方体
当你白天苦干了一天,晚上想研究到底同事口中的数据立方体是啥的时候,你发现,你的脑子已经免疫从眼睛摄入的内容的时候,切记,不是你脑子不灵光,而是你自己是真的傻了。洗洗睡吧(重点是洗洗!别问我为什么知道你不想洗脸、刷牙、洗脚)
认识数据
磨磨唧唧的教条主义,老子一不做二不休,直接不理你。
数据属性
标称属性
二元属性
序数属性
数值属性
数据的基本统计描述
这个还是可以看一下的,实际生产环境就是要去研究各种指标的。
先来一个“高大上”的公式:
我擦,竟然是个求平均数
他给起了个高大上的名字---
均值
还有。。。。。等回头啥时候有时间在慢慢研究吧,现在没兴致
众数
中列数
极差
四分位数
方差
标准差
四分位数极差
数据可视化
对了,先贴个图,以示高大上,(主要是用户召回策略,诱惑自己一下,以后看见了,我擦这图不错,研究一下)
问题
连看不看,咔嚓贴上:
2020/12/27