![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习-分类算法
文章平均质量分 77
继续微笑lsj
眼界决定未来
展开
-
Boost/adaBoost算法
1.1 Boosing算法起源 Boosting是一种提高任意给定学习算法准确度的方法。它的思想起源于 Valiant提出的 PAC ( Probably Approxi mately Cor2rect)学习模型。Valiant和 Kearns提出了弱学习和强学习的概念 ,识别错误率小于1 /2,也即准确率仅比随机猜测略高的学习算法称为弱学习算法;识别准确率很高并能在多项式时间内完成的学习算转载 2013-10-09 10:07:05 · 2005 阅读 · 0 评论 -
机器学习-分类算法总结
目前看到的比较全面的分类算法,总结的还不错. 2.4.1 主要分类方法介绍解决分类问题的方法很多[40-42] ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。 (1)决策树 决策树是用于分类和预测的主要技术之一,决策树学习是以实例为基础的归纳学习算法,转载 2013-10-06 16:44:30 · 3954 阅读 · 0 评论 -
贝叶斯最优分类器
贝叶斯常常有两个问题:(1)给定训练数据,最可能的假设是什么?(2)给定训练数据,对新实例的最可能分类是什么? 第一个问题用最大后验概率(MAP);第二个问题可利用MAP假设到新实例得到,实际上还有更好的办法。 6.18的意思表示我们用后验概率对当前分类进行概率加权,得到当前分类的概率,最后取最大的一个概率分类。那么上面这个实礼,最后将取反例。原创 2013-10-04 17:25:12 · 8287 阅读 · 2 评论 -
从决策树学习谈到贝叶斯分类算法、EM、HMM
分类与聚类,监督学习与无监督学习 在讲具体的分类和聚类算法之前,有必要讲一下什么是分类,什么是聚类,以及都包含哪些具体算法或问题。Classification (分类),对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种转载 2013-10-04 21:38:25 · 2621 阅读 · 0 评论 -
k近邻法与kd树
在使用k近邻法进行分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决的方式进行预测。由于k近邻模型的特征空间一般是n维实数向量,所以距离的计算通常采用的是欧式距离。关键的是k值的选取,如果k值太小就意味着整体模型变得复杂,容易发生过拟合,即如果邻近的实例点恰巧是噪声,预测就会出错,极端的情况是k=1,称为最近邻算法,对于待预测点x,与x最近的点决定了x的类别。k值得增大意味着整体的转载 2013-10-06 13:46:08 · 2206 阅读 · 0 评论 -
机器学习笔记之K近邻算法
基于实例的学习方法 K近邻算法其实是一种基于实例的学习算法。基于实例的学习方法只是简单的把样例存储起来。把这些实例中泛化的工作被推迟到必须分类实例的时候。每当学习器遇到一个新的查询实例,它分析这个新实例与以前存储的实例的关系。并据此把一个目标函数值赋给心的实例。 基于实例的学习方法包括K近邻算法和局部加权回归。本文只讲K近邻算法。 基于实例学习方法原创 2013-08-13 16:01:50 · 3460 阅读 · 0 评论 -
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法前言 前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章待写:1、KD树;2、神经网络;3、编程艺术第28章。你看到,blog内的文章与你于别处所见的任何都不同。于是,等啊等,等一台电脑,只好等待..”。得益于田,借了我一台电脑(借他电脑的时候,我连表示感谢,他说“能找到工作全靠你的博客,这点儿小忙转载 2013-09-30 14:34:27 · 1914 阅读 · 0 评论 -
机器学习笔记之人工神经网络(ANN)
人工神经网络(ANN)提供了一种普遍而且实际的方法从样例中学习值为实数、离散值或向量函数。人工神经网络由一系列简单的单元相互连接构成,其中每个单元有一定数量的实值输入,并产生单一的实值输出。 上面是一个汽车自动驾驶神经网络学习的例子:下方的图像是网络的输入,通过4个隐藏单元运算,得到30个输出(图的上方)决定汽车的行驶方向。 本文主要介绍两种基本单元:感知器和原创 2013-08-05 14:19:05 · 6207 阅读 · 0 评论 -
基于朴素贝叶斯分类器的文本分类算法
转载请保留作者信息:作者:phinecos(洞庭散人)Blog:http://phinecos.cnblogs.com/Email:phinecos@163.com Preface 本文缘起于最近在读的一本书-- Tom M.Mitchell的《机器学习》,书中第6章详细讲解了贝叶斯学习的理论知识,为了将其应用到实际中来,参考了网上许多资料,转载 2013-10-04 00:26:42 · 1730 阅读 · 0 评论 -
知乎架构
也许很多人还不知道,知乎在规模上是仅次于百度贴吧和豆瓣的中文互联网最大的UGC(用户生成内容)社区。知乎创业三年来,从0开始,到现在已经有了100多台服务器。目前知乎的注册用户超过了1100万,每个月有超过8000万人使用;网站每个月的PV超过2.2亿,差不多每秒钟的动态请求超过2500。在ArchSummit北京2014大会上,知乎联合创始人兼 CTO 李申申带来了知乎创业三年多来的首次转载 2016-03-22 15:32:22 · 1885 阅读 · 0 评论