![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘导论
yixiu00001
开心快乐是生活的真谛!
展开
-
大数据挖掘初识
近年来,大数据挖掘这个词越来越多的出现在人们的生活中。而这里面的大数据,并非只是数据量很大,还表示数据维度多,数据复杂度高,数据来源广泛。 当前,数据挖掘针对的数据有结构化、半结构化及无结构化的数据,在目标数据挖掘中,需要将不同类别不同来源的数据融合并交叉验证,最终得到一份涵盖充分且高质量的数据,助于人们的分析及决策。 大数据可以从三个方面刻画,(1)量级,volume,大量的数据;(2)速...原创 2014-06-10 09:30:14 · 82 阅读 · 0 评论 -
数据挖掘导论-概述
1、数据挖掘概念 数据挖掘是在大型数据存储库中,自动的发现有用信息的过程。数据挖掘是数据库中知识发现(knowledge discovery database KDD)不可缺少的 部分,而KDD是将未加工过的数据转换为有用信息的过程,包括数据预处理、数据挖掘和后处理等过程。 数据预处理:目的是将未加工的输入数据转化成适合分析的形式,包括融合多个数据源的数据,清洗数据以消除噪声或者重复的观测值...原创 2014-02-23 16:07:44 · 145 阅读 · 0 评论 -
数据挖掘导论-数据
1.数据集的一般特征 (1)维度, dimensionality ,是数据集中的对象具有的属性数目。 (2)稀疏性,sparsity (3)分辨率 resolusion 2.数据质量 噪声、伪像、偏倚、精度、准确率、离群点、遗漏、不一致的值、重复数据 (1)测量误差和数据收集错误 测量误差,measurement error,测量过程中导致的问题,测量值与实际值的差称为误差。 (...原创 2014-02-23 23:25:17 · 83 阅读 · 0 评论 -
数据挖掘导论-分类
分类 ,classification,分类任务就是通过学习得到一个目标函数(target function),把每个属性集x映射到一个预先定义的类标号y。 目标函数也称为分类模型(classification model) 决策树,decistion tree 1.概念 决策树是一种由节点和有向边组成的层次结构,树中包含三类节点 (1)根节点,root node ,没有入边,但有0条或...原创 2014-02-23 23:35:00 · 125 阅读 · 0 评论