数据挖掘
文章平均质量分 93
数据仓库与数据挖掘
枍汐
有所为,有所不为
展开
-
数据仓库实施
文章目录一、数据分析挖掘过程1、数据获取2、数据处理3、数据建模4、模型评价5、数据可视化二、ETL过程1、数据特征三、集中式数据仓库四、分布式数据仓库五、数据管控六、相关软件产品一、数据分析挖掘过程数据获取数据处理数据建模数据评价数据可视化1、数据获取数据的可能来源如下:关系型数据库格式化数据文件网页数据图片、视频等非格式化数据2、数据处理获取的数据需要进行数据质量分析和数据特征分析。为了提高数据质量,需要对数据进行处理:数据清理:缺失值处理、异常值处理数据集成:原创 2021-04-11 15:17:51 · 604 阅读 · 0 评论 -
数据仓库系统开发设计
文章目录一、数据仓库设计方法论1、建立数据仓库系统的参考步骤2、数据仓库系统的生命周期3、建立数据仓库系统的思维模式(1)、自顶向下(2)、自底向上4、数据仓库数据库的设计步骤二、概念模型设计1、信息包图法2、设计基于主题域的概念模型三、逻辑模型设计1、根据分析需求和信息包图制作星型图或雪花图2、确定主题的属性组3、事实表设计(1)、事实表特征:(2)、事实表类型(3)、粒度的选择(3)、聚合4、维表设计(1)、维度的分类(2)、维度的层次与级别(3)、常用维的设计模式四、物理模型设计1、主要工作2、物理存原创 2021-03-26 10:28:07 · 1581 阅读 · 2 评论 -
数据仓库数据存储与处理
文章目录一、信息系统中的数据类别1、数据仓库的三层数据结构2、数据分类①、主数据-参考数据-交易数据②、状态数据-事件数据③、当前数据-周期数据3、元数据二、建立数据仓库1、建立数据仓库的方法2、数据组织方式三、多维数据模型1、相关概念2、ROLAP3、子方体三、多维分析基本操作四、数据仓库的逻辑模型花时间一、信息系统中的数据类别1、数据仓库的三层数据结构2、数据分类信息系统中的数据按照不同的角度,可以分成不同的数据类别。①、主数据-参考数据-交易数据主数据主数据是关于业务实体的数据,一般原创 2021-03-19 01:02:01 · 2812 阅读 · 0 评论 -
数据挖掘简介
文章目录一、数据仓库1、概述(1)、特点(2)、组成2、OLAP技术(1)、OLAP与OLTP的比较(2)、OLAP相关概念(3)、OLAP分类二、数据挖掘1、分析方法2、数据挖掘与数据仓库的关系一、数据仓库数据仓库通常指一个数据库环境,而不是指一件产品。它提供用户用于决策支持的当前和历史数据,这些数据在传统的数据库中通常不方便得到。1、概述(1)、特点面向主题主题是一个抽象的概念,指用户使用数据仓库决策时所关心的重点领域,一个主题通常与多个操作型数据库相关。集成数据仓库中的数据是对原有分原创 2021-03-17 17:14:06 · 300 阅读 · 0 评论