- 博客(4)
- 收藏
- 关注
原创 数据挖掘导论学习总结——第四章
第四章:分类与预测分类方法用于预测数据对象的离散类别,预测则用于预测数据对象的梁旭取值,例如我们可以构造一个分类模型来对银行贷款进行风险评估,也可以简历一个预测模型以利用顾客收入与职业预测其可能用于购买计算机设备的支出大小。最初的数据挖掘方法大多都是建立在机器学习、专家系统、统计学和神经生物学等领域的分类与预测算法,目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展性。本章...
2018-08-23 12:08:45 1695
原创 数据挖掘导论学习总结——第三章
第三章:定性归纳从数据分析的角度出发,数据挖掘可以分为两类,描述性数据挖掘和预测性数据挖掘,而接下来要介绍的就是第一种情形,描述性数据挖掘,即以简洁概述的方式表达数据中存在的一些有意义的性质,也称为概念描述,或概要性总结。概念描述基本知识数据查询处理负责从数据库中取出数据并在必要时进行一些数据合计处理,而数据挖掘则是对数据进行深度分析并发现隐藏在数据中有意义的模式。最简单的描述性数据挖...
2018-08-22 23:02:44 825
原创 数据挖掘导论学习总结——第二章
数据预处理由于数据库系统所获数据量的迅速膨胀,从而导致了现实世界数据库中通常包含许多含有噪声、不完整、甚至是不一致的数据。数据预处理主要包括数据清洗、数据集成、数据转换和数据消减等。所谓噪声数据是指数据中存在着错误、或异常的数据。不完整数据是指感兴趣的属性没有值。不一致数据是指数据内涵出现不一致的情况。而数据清洗是消除数据中所存在的噪声以及纠正其不一致的错误;数据集成是指将来自多个数据源的...
2018-08-15 23:07:48 1356
原创 数据挖掘导论学习总结——第一章
数据挖掘基本知识Data Mining,即数据挖掘,是指从大量数据中挖掘或抽取知识,又称从数据库中知识发现(Knowledge Discovery from Database,KDD),它是指从大量数据抽取挖掘出未知的、有价值的模式或规律等,包括以下几个主要步骤:数据清洗(Data Cleaning):清楚数据噪声和挖掘主题明显无关的数据数据集成(Data Integration):将...
2018-08-15 20:00:53 1277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人