数据挖掘笔记
xuqn0606
这个作者很懒,什么都没留下…
展开
-
数据挖掘笔记——概念学习
概念学习可近似为分类问题,例如一个小孩子看过几种鸟的图片,如果再给他一张另外一种没见过的鸟的图片,他还是可以认出这是只鸟,换句话说他已经建立了“鸟”这一概念,进而根据一些特征进行判断是或不是属于这个概念。一、概念和概念学习的定义 概念是在一个更大的集合里面定义一个对象或者事物的子集,或者说是一个从更大的集合里面学到的布尔函数。 概念学习,指自动地给出概念的定义。...原创 2018-03-23 17:02:20 · 3223 阅读 · 1 评论 -
数据挖掘笔记——数据预处理
什么是数据? 数据对象和属性的集合一、属性的类型属性常常用操作来描述,操作有a. 相异性: b.顺序大小 c.加法减法d.乘法与除法根据这些操作可以将属性分为:a. 标称属性(Nominal attribute):只能区分是否相等,例如IDb. 序数属性(Ordinal attribute):可以区分顺序大小,例如...原创 2018-03-18 18:30:02 · 2062 阅读 · 0 评论 -
数据挖掘笔记——决策树
1.介绍 决策树是一种目标函数为离散值的学习方法(区别于回归),学习到的函数可以用树形表示也可以使用if-then规则来增加可读性。 什么时候考虑使用决策树:(1)实例可以描述为属性-值对,即监督学习 (2)目标函数是离散值 ...原创 2018-04-08 17:30:31 · 746 阅读 · 0 评论 -
数据挖掘笔记——遗传算法
遗传算法来源于进化论,可以理解为一开始我们产生很多个随机解,构成第一代假设集合(也叫做种群),由这些随机解产生一代新的种群并进行假设解集合的更新,在产生下一代随机解过程中,好的解保留,差的解遗弃,即通过变异和交叉迭代每一步。 总结来说,遗传算法是在候选假设中找到最优假设的过程。1.遗传算法结构 (1)种群:在算法中迭代更新的假设集合 (2)适应度函数...原创 2018-04-13 14:10:13 · 2100 阅读 · 0 评论 -
数据挖掘笔记——贝叶斯学习
贝叶斯决策理论是朴素贝叶斯分类、贝叶斯信念网络、EM算法的基础。特点:(1)每个观测值都可以提高/降低估计值 (2)先验知识可以和观测数据共同决定最终的假设概率 (3)概率预测,可以提供假设好坏的度量 (4)新实例可以结合多个假设的预测值,依概率加权1.贝叶斯定理 目的:学习到最优假设,即概率最大可能性最高的假设,这就是我们所说的最大后验...原创 2018-04-25 22:11:58 · 721 阅读 · 0 评论