![](https://img-blog.csdnimg.cn/20191222214125494.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
大数据技术开发以及研究
来自偶然的尘土
生命、生存、生活!
展开
-
数据ETL
1. ETL之数据清洗 数据清洗的概念:“数据清洗确保无法辨认的数据不会进入数据仓库。无法辨认的数据将影响到数据仓库中通过联机分析处理(OLAP)、数据挖掘和关键绩效指标(KPI)所产生的报表。”数据清洗, 是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。 在操作中,数据清洗通常会占据分析过程的50%—80%的时间。所以数据清洗的过程就显得尤为重要,在下面的图上...原创 2019-10-24 13:32:26 · 1559 阅读 · 0 评论 -
数据分析常用的术语
缘由 在进行数据分析时,经常会遇到一些分析指标或术语。这些术语是帮助我们打开思路,通过多个角度对数据进行深度解读,可以说是前人已经总结和使用的数据分析方法。下面是数据统计分析常用的指标或术语: 1.平均数 一般指算术平均数。算术平均数是指,全部数据累加除以数据个数。它是非常重要的基础性指标。 几何平均数:适用于对比率数据的平均,并主要用于计算数据平均增长(变化)率。 加权平均数:普通...转载 2019-07-01 10:45:36 · 3226 阅读 · 0 评论