- 博客(6)
- 收藏
- 关注
原创 《机器学习实战》读书笔记 第四章 朴素贝叶斯(part 2)
只要有一天睡眠不足,接下来几天都会丧失全部战斗力。 ——论我为什么抓紧一切时间补觉 ***************************************************************************************************** part 2 基于字标注的最大熵分词模型 “最大熵”是一种人生态度。 它是每次犹豫不决时就
2015-01-19 14:15:58 673
原创 《机器学习实战》读书笔记 第三章 决策树(part 3)
#以下为ID3算法个征独家解(tu)说(cao)版本。话说python的注释为何是红色。。 from math import log import operator #1.构建样本数据集,前两个维度是特征维度(对应于labels里的特征名),最后一个维度是类别维度(鱼类、非鱼类) def createDataSet(): dataSet = [[1, 1, 'yes'],
2015-01-07 14:46:00 399
原创 《机器学习实战》读书笔记 第三章 决策树(part 2)
part 2 树、字典、递归 上一篇讲解了决策树算法的数学理论基础,接下来讲讲具体是怎么实现的。 首先,决策树是以一棵树的形式进行存储的。树是一种数据结构,它是若干结点的集合,是由唯一的根结点和若干互不相交的子树组成的(翻开《数据结构高分笔记》,念)。就像这样: 第三章 决策树(part 2)" TITLE="《机器学习实战》读书笔记 第三章 决策树(part 2)" /> 目前我们只
2015-01-07 14:45:56 556
原创 《机器学习实战》读书笔记 第三章 决策树(part 1)
part 1 信息量、香农熵、信息增益 所谓决策树算法,就是一次次根据某个特征进行分类,比如“20个问题猜出ta是谁”游戏,你可以问“是男的吗”“是直的吗”“是哥大的吗”之类的问题,每次得到答案,你的范围就缩小一些,如此循环往复以至于——得到一个确定结果为止。(不过决策树算法并不一定采用二分法) 听起来很简单的样子,但重点是,首先应选择哪个特征进行划分?其次?再次? 划分数据集的原则是:
2015-01-07 14:45:53 592
原创 《机器学习实战》读书笔记 第二章 k-近邻算法
即将翻篇的2014年是我的编程元年,这一年从换工作到考研各种忙。等到一切都尘埃落定,就打算静下心来,把这一年学到的东西好好总结一下,也分享给后来人攒攒rp~相信我遇到的问题很多新手都会遇到的,如果能带给大家一点帮助,我就满足了。 《机器学习实战》是我第一本编程书。因为13年左右这本书很火的样子,又听说python很简单白痴都能看懂,于是我无视了自己在编程方面一无所知的事实,一有空就马上看起来了。
2015-01-07 14:45:51 467
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人