Machine learning
文章平均质量分 68
fengsser
这个作者很懒,什么都没留下…
展开
-
机器学习实践 学习笔记1 Machine learning basics
1.例子: 通过特征,预测鸟兽的种类。 2.分类: 有监督学习: 分类和回归。分类主要任务是将实例数据划分到合适的分类中。回归的主要任务是预测熟知类型数据。 监督学习类算法必须要知道预测什么。 无监督学习: 数据没有类别信息,也不会给定目标值。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类(clustering)。将寻找描述数据统计值的原创 2015-08-22 16:36:18 · 915 阅读 · 1 评论 -
机器学习实践 学习笔记2 Classifying with k-Nearest Neighbors
1.k-近邻算法(k-Nearest Neighbors,kNN) 工作原理: knn算法属于监督类型算法。首先我们有样本训练集,知道每一条数据的分类。继而,我们输入没有分类的新数据,将新数据的每个特征与样本集中的对应项进行比较,提前样本集中最相思的数据,这样我们可以获得该数据的分类。一般来说,我们只选择样本集中前k个最相似的数据,通常k不大于20.最后,选择k个相似数据中出现最多的分类,作为原创 2015-08-23 23:18:13 · 5884 阅读 · 5 评论 -
机器学习实践 学习笔记3 decision trees
决策树(decision trees) 工作原理: 决策树属于监督类型的算法,同样,我们有数据集,知道每一条数据的分类。然后我们按照某种规则,选取数据集上的特征作为分割点,把数据集进行划分。循环重复以上动作,直至所有数据集各自的分类都是唯一的,或者所有特征已经被选择无法再进行划分。使用何种规则进行特征的选取下文将会叙述。 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失原创 2015-08-28 17:03:44 · 2130 阅读 · 0 评论 -
机器学习实践 学习笔记4 naïve Bayes
朴素贝叶斯(naïve Bayes) 工作原理: 朴素贝叶斯之所谓为“朴素”,是因为整个形式化过程只做最原始,最简单的假设。朴素贝叶斯是贝叶斯决策伦的一部分,贝叶斯决策伦的核心思想是: 选择具有最高概率的决策。 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 使用朴素贝叶斯进行文档分类:原创 2015-08-30 14:29:00 · 1734 阅读 · 0 评论 -
机器学习基石学习笔记1 机器学习及其分类
对应第1,3课视频 1.什么是机器学习 2.什么情况下使用机器学习 例如:要识别图片里是否有树,我们又很难去硬写程序去定义树来识别。 3.机器学习流程 learning model = learning algorithm A and hypothesis set H f是现实中的规律,由规律产生出了数据data,我们收集这些data作为输入,通过学习原创 2015-09-01 20:57:28 · 635 阅读 · 0 评论 -
分享 机器学习基石笔记
主要总结了why can machines learn 和 how can machines learn 两块 总结得很好 http://beader.me/mlnotebook/index.html原创 2015-09-10 08:51:29 · 662 阅读 · 0 评论 -
机器学习基石学习笔记2 机器学习为什么可行
机器学习中,我们从样本数据出发,最后推断出接近真实规律的g(x)。 那么由样本数据推断出的g(x)可以接近真实规律的理论依据是什么呢?我们可以从概率的角度去解决这个问题。 假设一个罐子(总体,bin)里面装满了两种不同颜色(orange,green)的小球。 假设P(orange) = u, P(green) = 1 - u原创 2015-09-09 11:21:34 · 1140 阅读 · 0 评论 -
机器学习基石学习笔记3 VC Dimension(1)
上章我们提到了当Ein与Eout足够接近,且Ein很小时,我们就能说机器学习确实学到了东西。而Ein低与否,与A在hypothesis set中的选择密切相关。当hypothesis set中的可选h(x) 越多,就越有可能找到一个让Ein很小的h(x),然而M太多,却又会导致出现bad data的概率增大,导致|Ein-Eout|>ϵ 还记得我们用了一个不等式来衡量bad data出现的概率:原创 2015-09-09 15:47:46 · 1539 阅读 · 0 评论 -
LDA主题模型小结
简述LDA 什么是LDA主题模型 主题分布与词分布 两点分布 二项分布 多项式分布 参数估计 极大似然估计 贝叶斯估计 共轭先验分布 形式化LDA 简述LDALDA涉及的知识很多,对于作者这样的菜鸟来说想要弄清楚LDA要费一番功夫,想简单说清更是不易,写下此文,也是希望在行文的过程中,把握LDA主要脉络,理顺思路。也希望我理解的方式与顺序,能帮到一部分初学的朋友。如果有不对的地方,也欢迎作出指正。什原创 2016-10-16 21:42:54 · 3425 阅读 · 0 评论