![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据
人间折耳根
这个作者很懒,什么都没留下…
展开
-
《数据挖掘 实用机器学习工具与技术》读书笔记 第1章-第3章
第一章 绪论机器学习的定义:机器学习是从大量的数据中自动或半自动地寻找模式的过程,而且这个模式必须是有用的。我们可以用同样的方法为学习建立一个可操作的定义:当事务以令其自身在将来表现更好为标准来改变其行为时,它学到了东西。学习意味着思考和目的。在机器学习领域,一个永恒的成功的研究过程是以压缩一个海量数据库开始的。数据挖掘的应用领域:web挖掘(PageRank算法)、包含评判的决策、图像筛选、负载预测、诊断、市场和销售等。第二章 输入:概念、实...原创 2020-11-12 15:05:19 · 218 阅读 · 0 评论 -
《数据库系统 数据库与数据仓库导论》读书笔记 Part3 数据仓库的实现与使用
多数情况下,数据仓库都被建模成关系数据库。目前市场上有很多OLAP/BI工具,例如Microstrategy、IBM的Cognos-acquired、SAP的Business Objects-acquired、Oracle的Hyperion-acquired、Microsoft等。OLAP/BI工具中最常用的三个基本功能:1. 切片和切块:从已经显示的结果里增加、替换或者消除制定的维度属性(或者是消除维度属性中的制定值)。2. 旋转:与切片和切块操作不同,旋转操作不改变原始查询..原创 2020-11-07 15:21:42 · 112 阅读 · 0 评论 -
《数据库系统 数据库与数据仓库导论》读书笔记 Part 3 数据仓库与数据集市建模
数据仓库与数据集市建模最常用的3种方法:· 规范化数据仓库 —— 通常指Inmon方法:思路就是将一个中心数据仓库建模为ER模型,因此可以映射为一个规范化的关系型数据库模型,规范化的关系型数据库则用作数据仓库的物理存储。· 维度建模数据仓库 —— Kimball方法:将数据仓库看作是交错的维度建模数据集市的集合(如维度模型星座)这些数据集市集成了源自操作性数据源中的对分析有用的数据。· 独立数据集市 —— 需要创建并维护多个ETL系统。 ...原创 2020-11-07 14:11:13 · 146 阅读 · 0 评论 -
《数据库系统 数据库与数据仓库导论》学习笔记 Part 2 分析型数据库
每个星型模式中都包含一个与日期信息相关的维度。在一个典型的设计良好的星形模式中,任何维度表中的记录数都小于事实表中的纪录数。创建代理主码 —— 可以处理所谓的缓慢变化的维度。事实表 = 将表连接到维度表的外码 + 分析主题相关的度量 + (其他非度量的属性)其他非度量的属性,有2种典型的:事物标识码和事物时间。· 事物标识码举例:哪些产品在相同的交易事务中被出售· 这种事物标识码的分析一般称为“购物篮数据分析”,也叫做“关联规则挖掘”/“关联性分组”· 让事实...原创 2020-11-07 13:56:13 · 193 阅读 · 0 评论 -
《数据库系统 数据库与数据仓库导论》读书笔记 Part 1 操作型数据库
分析型数据库 vs 操作型数据库 —— 分析信息需要在操作信息的基础上得到。1:M联系或1:1联系的属性都是不必要的,M:N中必要。实体完整性约束 —— PK 不为空。联系到关系的映射: 1:M联系的映射 —— M侧实体所映射得到的关系又一个FK,如EMPLOYEE表中有一个FK叫DeptID,指向DEPARTMENT表中的DeptID。关于参与方式,有2中,强制参与和可选参与,可选参与可以在后面加“(O)”。 M:N联系的映射 —— 映射为关系,这个关系有...原创 2020-11-07 10:11:03 · 225 阅读 · 0 评论 -
《高校数据仓库系统建设与应用》陈云 读书笔记 第一章 绪论
1. 数据仓库具有4个特点a. 面向主题性面向主题是数据仓库中组织数据的基本原则,数据仓库中的所有数据都是围绕某一主题组织、展开的。b. 集成性数据仓库的集成性是指根据决策分析的要求,将分散于各处的源数据进行抽取、筛选、清理、综合等集成工作,使所有数据能够统一、有机地整合在一起。c. 非易失性一般不对数据进行更新和删除操作,只进行查询。d. 时变性数据应随着时间的推移而发生变化。因为如果依据10年前的数据进行分析,那决策带来的后果十分可怕。也就是说数据仓库要不断生成主题的新快原创 2020-11-02 10:57:36 · 262 阅读 · 1 评论