数据仓库
哇哈哈水有点甜
这个作者很懒,什么都没留下…
展开
-
数据清洗规则
数据清洗规则一、 规则总览数据清洗针对的对象主要有四个——缺失值、异常值、重复值和无用值,针对不同对象的不同形式,采取相应的方法进行处理,从而得到期望的数据。1.1 非空校核要求字段为非空的情况下,对该字段数据进行校核。如果数据为空,需要进行相应处理。1.2 重复校核多个业务系统中同类数据经过清洗后,在统一保存时,为保证主键唯一性,需进行校核工作。1.3 异常值校核包括取值错误、格...原创 2019-05-28 16:14:39 · 12487 阅读 · 0 评论 -
OLAP和DM(Data Mining 数据挖掘)的区别
OLAP(Online Analytical Process)联机分析处理:意指由数据库所连结出来的在线分析处理程序。有些人会说:“我已经有OLAP的工具了,所以我不需要Data Mining。” 事实上两者间是截然不同的,主要差异在于Data Mining用在产生假设,OLAP则用于查证假设。简单来说,OLAP是由使用者所主导,使用者先有一些假设,然后利用OLAP来查证假设是否成立;而Dat...转载 2019-06-17 09:04:12 · 1132 阅读 · 0 评论