数据挖掘——第一章:概述

1. 数据分析与数据挖掘

1.1 数据分析

定义:数据分析是指采用适当的统计分析方法对收集到数据进行、概括和总结,对数据进行恰当地描述提取出有用的信息过程

例:连锁超市对上季度各种商品的销售量进行统计和分析,得出各种商品需求量和销售曲线,采购部门依次为依据进行采购策略调整

常见图:排列图,因果图,散布图,直方图,控制图
在这里插入图片描述
在这里插入图片描述

1.2 数据挖掘

数据挖掘 (Data Mining,DM) 是指从海量的数据中通过相关算法来发 现隐藏在数据中的规律和知识过程 。

为什么进行数据挖掘?

  • 数据的爆炸式增长 : 从TB 到PB
  • 数据是丰富的,急需发现知识 数据是丰富的,急需发现知识 !

通常 将数据 挖掘视为中“知识发现 ”的同义词,也可以认为数据挖掘是知识发现中的一个步骤。

1.3 知识发现(KDD)的过程

重点
在这里插入图片描述

1.4 数据分析与数据挖掘的区别

在这里插入图片描述

1.5 数据分析与数据挖掘的联系

  • 数据分析的结果往需要进一步挖掘才能得到更加清晰,而数据挖掘发现知识的过程也需要对先验约束进行一定调整而再次进行数据分析。
  • 数据分析可以将变成信息,而挖掘知识如果需要从数据中发现知识,往需要分析和挖掘相互配合共同完成任务。

2. 分析与挖掘的数据类型

2.1 数据库数据

数据库系统(DataBase System࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

平什么阿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值