数据挖掘 概念与技术 笔记(Data Mining concepts and Techniques Third Edition Notebook)

第一章 引论1、什么是数据挖掘?数据挖掘是一个多学科领域,数据挖掘可以用多种方法定义。它也是数据中的知识发现(KDD)的同义词。而另一些人只是把数据挖掘视为只是发现过程的一个基本步骤。具体步骤:数据清洗数据集成数据选择数据变换数据挖掘模式评估知识表示...
摘要由CSDN通过智能技术生成

第1章 引论

1.1 什么是数据挖掘?

数据挖掘是一个多学科领域,数据挖掘可以用多种方法定义。它也是数据中的知识发现(KDD)的同义词。而另一些人只是把数据挖掘视为只是发现过程的一个基本步骤。具体步骤:

  1. 数据清洗
  2. 数据集成
  3. 数据选择
  4. 数据变换
  5. 数据挖掘
  6. 模式评估
  7. 知识表示

1.2 什么类型数据可以挖掘?

数据挖掘可以用于任何类型的数据,只要数据对目标应用是有意义的。在应用中,数据最基本形式就是**(1)数据库数据(2)数据仓库数据(3)事务数据**。本书提供的概念和技术集中考虑这类数据。当然数据挖掘也可以用于其他类型数据(例如:数据流、有序/序列数据、图和网络数据、空间数据、文本数据、多媒体数据和万维网)
1)数据库数据
数据库系统,也称之为数据库管理系统(DBMS),由一组内部相关的数据(称之为数据库)和一组管理和存取数据的软件程序组成。当数据挖掘用于关系数据库时,可以进一步搜索趋势和数据模式。关系数据库时数据挖掘最常见、最丰富的信息源,因此数据库数据是数据挖掘研究的一种主要数据形式。
2)数据仓库
数据仓库是一个从多个数据源收集的信息存储库,存放在一致模式下,并且通常驻留在单个站点上。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
No part of this publication may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording, or any information storage and retrieval system, without permission in writing from the publisher. Details on how to seek permission, further information about the Publisher’s permissions policies and our arrangements with organizations such as the Copyright Clearance Center and the Copyright Licensing Agency, can be found at our website: www.elsevier.com/permissions. This book and the individual contributions contained in it are protected under copyright by the Publisher (other than as may be noted herein). Notices Knowledge and best practice in this field are constantly changing. As new research and experience broaden our understanding, changes in research methods or professional practices, may become necessary. Practitioners and researchers must always rely on their own experience and knowledge in evaluating and using any information or methods described herein. In using such information or methods they should be mindful of their own safety and the safety of others, including parties for whom they have a professional responsibility. To the fullest extent of the law, neither the Publisher nor the authors, contributors, or editors, assume any liability for any injury and/or damage to persons or property as a matter of products liability, negligence or otherwise, or from any use or operation of any methods, products, instructions, or ideas contained in the material herein.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值