人工智能数据挖掘

数据挖掘概述
数据挖掘概念与发展
有用的知识,形成知识就是数据挖掘。从这些数据中提取有价值的信息和知识以帮助做出明智的决策成为巨大的挑战。
数据挖掘,又称为数据库知识发现。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用信息和知识的过程。
第一,数据源必须是大量的、真实的,真实的数据往往含有噪声或缺失;第二,发现的是用户感兴趣的知识;第三,发现的知识要可接受,可理解,可应用,能支持特定的问题发现,能够支持决策,可以为企业带来利益,或者为科学研究寻找突破口。

数据挖掘的任务
数据挖掘的任务可以分为预测任务和描述型任务。
预测型任务就是根据其他属性的值预测特定属性的值,如回归、分类、离群点检测等。
描述型任务就是寻找、概括数据中潜在联系的模式,如聚类分析、关联分析、演化分析、序列模式挖掘。

数据挖掘过程与方法
数据挖掘只是数据挖掘过程的一部分,完整的挖掘过程还应包括以下步骤:定义业务目标、甄别数据源、收集数剧、选择数据、数据质量检查、数据转换和结果解释。
在数据挖掘阶段,概括而言,数据挖掘分析员可以使用的数据挖掘方法主要有如下几个:
预估模型,包括分类和预估量种类型。
聚类技术。
连接技术。
时间序列分析。

基于规则的分类器
基于规则的分类器是使用一组if…then…规则来对记录进行分析的技术。提取分类规则的方法有两大类:直接方法和间接方法。
顺序覆盖算法经常被用来直接从数据中提取规则。

朴素贝叶斯分类算法

聚类
概念
聚类分析的基本方法
聚类分析的研究主要基于距离和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值