数据挖掘理论
《数据挖掘导论》笔记、数据分析/挖掘理论知识
bakalaka
时间是最好的朋友
展开
-
《数据挖掘导论》- 读书笔记(6) - 分类、关联、聚类、异常检测
第五章 分类算法https://blog.csdn.net/weixin_43329319/article/details/100167295?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160523445119725266962629%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=1605234451197转载 2020-11-13 10:49:20 · 789 阅读 · 0 评论 -
《数据挖掘导论》- 读书笔记 - 总结
0.概述数据挖掘导论涉及到的知识比较丰富,梳理下内容,为后面推荐系统设计做铺垫。1.什么是数据挖掘数据挖掘是在大型数据存储库中,自动发现有用信息的过程。数据挖掘技术用来探测大型数据库,发现先前未知的有用模式。数据挖掘还可以预测未来观测结果,例如预测一位新的顾客是否会在一家百货公司消费100美元以上。数据挖掘是数据库中知识发现(KDD)不可缺少的一部分,而KDD是将未加工的数据转换为有用信息的...转载 2019-11-18 20:45:26 · 1656 阅读 · 0 评论 -
《数据挖掘导论》- 读书笔记(5)- 分类:基本概念、决策树与模型
第4章 分类:基本概念、决策树与模型评估 分类任务就是确定对象属于哪个预定义的目标类。分类问题是一个普遍存在的问题,有许多不同的应用。例如:根据电子邮件的标题和内容检查出垃圾邮件,根据核磁共振扫描的结果区分肿瘤是恶性的还是良性的,根据星系的形状对它们进行分析。 本章介绍分类的基本概念,讨论诸如模型的过分拟合等关键问题,并提供评估和比较分类技术性能的方法。尽管本章主要关注一种称作...转载 2019-11-18 20:25:55 · 4048 阅读 · 1 评论 -
《数据挖掘导论》- 读书笔记(4)- 探索数据
第3张 探索数据 第2章讨论知识发现过程中重要的高层数据问题。本章是数据探索,对数据进行初步研究,以便更好地理解它的特殊性质。数据探索有助于选择合适的数据预处理和数据分析技术。甚至可以处理一些通常由数据挖掘解决的问题。例如,有时可以通过对数据进行直观检查来发现模式。 本章包括三个主题:汇总统计、可视化和联机分析处理OLAP。汇总统计(如值集合的均值和标准差)和可视化技术是广泛用...转载 2019-11-18 20:24:24 · 406 阅读 · 0 评论 -
《数据挖掘导论》- 读书笔记(3)- 数据
第2章 数据 本章讨论一些与数据相关的问题,对于数据挖掘的成本至关重要。 数据类型 数据集的不同表现在很多方面。例如,用来描述数据对象的属性可以具有不同的类型---定量的或定性的,并且数据集可能具有特定的性质,例如,某些数据集包含时间序列或彼此之间具有明显联系的对象。毫不奇怪,数据的类型决定我们应使用何种工具和技术来分析数据。此外,数据挖掘研究常常是为了适应新的应用领域和新的...转载 2019-11-18 20:17:58 · 7152 阅读 · 0 评论 -
《数据挖掘导论》- 读书笔记(2)- 绪论
第1章 绪论 数据挖掘是一种技术,将传统的数据分析方法和处理大量数据的复杂算法相结合。数据挖掘为探查和分析新的数据类型以及用新方法分析旧有数据类型提供了令人振奋的机会。我们概述数据挖掘,并列举所涵盖的关键主题。 介绍数据挖掘分析技术的一些应用: 商务:借助POS数据收集技术[条码扫描器、射频识别和智能卡技术],零售商可以在其商店的首映太收集顾客购物的最新数据。零售商可以利用...转载 2019-11-18 20:15:06 · 974 阅读 · 0 评论 -
《数据挖掘导论》- 读书笔记(1)- 目录
本文转载自:https://www.cnblogs.com/pythonMLer/p/5747827.html数据挖掘导论 本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样能够在透彻地理解数据挖据的基础的同时,还能够了解更多重要的高级主题。 目...转载 2019-11-18 20:12:12 · 419 阅读 · 0 评论 -
《数据挖掘导论》学习笔记:第1-2章
本文转载自:https://blog.csdn.net/u013232035/article/details/48281659 本文主要是在学习《数据挖掘导论(完整版)》中的学习笔记,主要用来梳理思路,并没有多少思考。第1章 绪论1.1 什么是数据挖掘KDD: K nowledge D iscovery in D atabase过程如下:Created with Raph...转载 2018-08-13 21:23:30 · 2364 阅读 · 0 评论