【Python数据挖掘概念、方法与实践】

本书探讨了数据挖掘的概念,包括模式识别、数据挖掘的定义与目标,如KDD过程和CRISP-DM过程。介绍了数据选择、预处理、变换、挖掘等步骤,以及知识表示和评估。强调了数据清理、数据整合、预测分析和大数据在数据挖掘中的作用。
摘要由CSDN通过智能技术生成

第一章 扩展你的数据挖掘工具

  • 模式识别
    面对感官信息时,人类自然想要寻找模式,对其进行区别、分类和预测。这种寻找周围模式的过程是人类的基本活动,人类的大脑对此很擅长。利用这种技能,我们的祖先更好地掌握了狩猎、聚会、烹饪和组织知识。因此,人类最早计算机化的任务是模式识别和模式预测也就不足为奇了,这种渴望一直持续到现在。近来,根据给定项目的目标,使用计算机找出数据中的模式,已经涉及数据库系统、人工智能、统计学、信息检索、计算机视觉和其他各种计算机科学子领域,以及信息系统、数学或者商业等。不管我们将这种活动称作什么——数据库中的知识发现、数据挖掘、数据科学,其主要使命始终是找出有趣的模式。

模式识别是人类的一项基本能力

  • 第一章主要内容
    什么是数据挖掘
    我们如何进行数据挖掘
    数据挖掘中使用哪些技术
    如何建立数据挖掘环境

如何建立数据挖掘环境是重点

什么是数据挖掘

  • 数据挖掘与知识发现
  • 比较术语
    • 机器学习
      是计算机中科学中的一个非常特殊的子领域,其焦点是开发能从数据中学习以做出预测的算法。但是并不是所有数据挖掘都试图从数据中做出预测或者学习。有时候,我们只是想要找到数据中的一个模式。
    • 预测分析
      各个领域中试图从数据中作出预测的计算解决方案的统称
    • 大数据
      与我们是要搜索数据中的模式还是简单地存储这些数据无关。
    • 数据科学
      是最接近KDD过程的术语,数据挖掘是他们的一个步骤。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值