数据挖掘简介

最新推荐文章于 2022-11-01 17:17:38 发布

cowboy_wz

最新推荐文章于 2022-11-01 17:17:38 发布

阅读量1.4k

点赞数

分类专栏：知识梳理文章标签：数据挖掘数据库数据分析网络算法任务

知识梳理专栏收录该内容

35 篇文章 0 订阅

订阅专栏

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的，以及最终可理解的模式的非平凡过程。它是一门涉及面很广的交叉学科，包括 机器学习、 数理统计、 神经网络、 数据库、 模式识别、 粗糙集、 模糊数学等相关技术。

由于数据挖掘是一门受到来自各种不同领域的研究者关注的交叉性学科，因此导致了很多不同的术语名称。其中，最常用的术语是"知识发现"和"数据挖掘"。相对来讲，数据挖掘主要流行于统计界（最早出现于统计文献中）、数据分析、数据库和管理信息系统界；而知识发现则主要流行于人工智能和机器学习界。

数据挖掘可粗略地理解为三部曲：数据准备（data preparation）、数据挖掘，以及结果的解释评估（interpretation and evaluation）。

根据数据挖掘的任务分，有如下几种：分类或预测模型数据挖掘、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等。

根据数据挖掘的对象分，有如下若干种数据源：关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗产（legacy）数据库，以及Web数据源。

根据数据挖掘的方法分，可粗分为：统计方法、机器学习方法、神经网络方法和数据库方法。统计方法中，可细分为：回归分析（多元回归、自回归等）、判别分析（贝叶斯判别、费歇尔判别、非参数判别等）、聚类分析（系统聚类、动态聚类等）、探索性分析（主元分析法、相关分析法等）、以及模糊集、粗糙集、支持向量机等。机器学习中，可细分为：归纳学习方法（决策树、规则归纳等）、基于范例的推理CBR、遗传算法、贝叶斯信念网络等。神经网络方法，可细分为：前向神经网络（BP算法等）、自组织神经网络（自组织特征映射、竞争学习等）等。数据库方法主要是基于可视化的多维数据分析或OLAP方法，另外还有面向属性的归纳方法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

cowboy_wz CSDN认证博客专家 CSDN认证企业博客

码龄19年

360: 原创

6万+: 周排名

182万+: 总排名

321万+: 访问

: 等级

3万+: 积分

2003: 粉丝

427: 获赞

322: 评论

1326: 收藏

私信

关注

热门文章

分类专栏

java 学习 18篇
mat_lab 51篇
svm研究 15篇
TEX之路 6篇
探知索识 55篇
数学王国 31篇
数据挖掘 60篇
文本分类 61篇
机器学习 82篇
知识梳理 35篇
知识网格 31篇
科研之路 97篇
算法描述 22篇
问题集锦 57篇

最新评论

粗糙集理论
冲击文: C是属性的子集
如何快速切换静态和动态ip
粒子白: 可以用感谢
Attempt to execute SCRIPT plot as a function?
qq_33859558: 谢谢~
一稿多投与重复发表
逯先生。: 老师您好我想问一下，我想给B期刊投稿，但是因操作失误投到了A期刊那里，并且我知编辑的信是写的B期刊的。我立马给编辑和该期刊发送电子邮件说明情况请求撤销该次投稿，在没得到他们回复之前，我继续投B期刊算一稿多投吗？
手机、数码相机数据丢失恢复方法汇总
dintc: 需要恢复的卡暂时不要存入新的文件，可以用读卡器连接到电脑，再用 AornData 恢复里面的文件。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。