- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 朴素贝叶斯以及三种常见模型推导
朴素贝叶斯在机器学习中,朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器。朴素贝叶斯算法Naive Bayes定义中有两个关键定义:特征之间强假设独立和贝叶斯定理.这两个定义就是朴素贝叶斯的关键.接下来先了解一下这两个定义.贝叶斯定理贝叶斯定义是概率论中的一个定理,它跟随机变量的条件概率以及边缘概率分布有关.通常,事件A在事件B(发生)的条件...
2018-12-26 10:44:03 3513 1
原创 词袋模型BoW和词集模型SoW比较
Bag-of-Words词袋模型,经常用在自然语言处理和信息检索当中.在词袋模型中,一篇文本(文章)被表示成"装着词的袋子",也就是说忽略文章的词序和语法,句法;将文章看做词的组合,文中出现的每个词都是独立的,不依赖于其他词.虽然这个事实上并不成立,但是在实际工作中,效果很好.Set-of-Words词集模型SoW:用0-1作为文章中词的数量表示.在词袋模型BoW中,每个词的数量表示有多种方...
2018-12-23 11:10:45 1645
原创 11. Container With Most Water
题意给定n个非负整数a1,a2,...,ana_1,a_2,...,a_na1,a2,...,an,其中每个数表示坐标点(i,ai)(i,a_i)(i,ai),i是数组下标,aia_iai是对应高度.寻找两条线,使得两条线构成的长方形面积最大,盛水最多.Example:Input: [1,8,6,2,5,4,8,3,7]Output: 49解暴力破解对每种情况进行循环,计...
2018-12-17 22:25:22 114
原创 [Learning-from-data]无限假设空间的可学性以及模型泛化
Theory of Generalization样本外误差EoutE_{out}Eout测量了训练集D上学习的模型在unseen data上的泛化能力.EoutE_{out}Eout是基于整个输入空间X上的表现来测量的.如果使用样本集来计算模型的EoutE_{out}Eout,这些样本点必须是"unseen",没有在训练集中出现过.对应的,样本内误差EinE_{in}Ein是基于训练集...
2018-12-16 17:18:33 1090
原创 [Learning-from-data]有限假设空间的可学性
明白机器学习中的通用理论,然后在细化到数学推导,之后再明白局限性以及改进;辅助以代码.笔记.防止看得太过于枯燥.-What is learning?-Can a machine learn?-How to do it?-How to do it well?-Take-home lessons.“学习”我们人类的学习过程,有时候并不是直接从定义学习,更像是实例学习,比如说小孩学习...
2018-12-12 21:21:03 1246
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人