机器学习
長風破浪
这个作者很懒,什么都没留下…
展开
-
机器学习(1)——常用术语
机器学习(1)——常用术语欠拟合:模型假设太严格,所以模型不能拟合到实际数据解决方案:使用更多的特征有利于拟合,选用一个学习能力更好的拟合算法 过拟合:算法不仅学习了数据,而且吧噪声也当做信号学习,这样算法推广能力差解决方案:增加训练数据量可使得拟合曲线更光滑,减少特征数量降低过拟合程度,使用学习能力差的算法。原创 2015-01-05 09:40:54 · 1285 阅读 · 0 评论 -
机器学习(2)——Adaboost上
机器学习(2)——Adaboost 上原创 2015-01-05 20:43:08 · 596 阅读 · 0 评论 -
机器学习(6)——Logistic回归
机器学习(6)——Logistic回归一、Sigmoid函数 首先阐述一下回归的概念,假设现在有一些数据点,我们用一条直线对这些点进行拟合,这个过程就叫做回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界建立回归公式,以此进行分类。我们想要的函数应该是,能接收所有的输入,然后预测出类别。在二分类的情况下上述函数输出0或1。最典型的函数就是单位阶跃函原创 2015-03-15 14:45:07 · 826 阅读 · 0 评论 -
机器学习(4)——KNN算法及手写数字的识别(二)
机器学习——KNN算法及手写数字的识别(二) 说的是手写数字识别,你拿一堆 这样的“图片”去识别,分类有什么意思呀。 在上一遍博文中我们有了一个对手写数字采用kNN算法的分类器,这篇博文将利用该分类器完成一个完整的手写数字分类功能。程序的输入为我们手机拍摄的一张照片如下图所示: 为了使用我们训练好的分类器,我们需要对这张照片进行处原创 2015-03-08 21:15:30 · 1288 阅读 · 0 评论 -
机器学习(3)——KNN算法及手写数字的识别(一)
机器学习——KNN算法及手写数字的识别(一)邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。搬出一张最常见的图,来直观的展示什么是KNN算法: kNN比较好理解,其一般过程如下: 对未知类别属性的数据集中的每原创 2015-03-07 10:37:06 · 1303 阅读 · 0 评论 -
机器学习—朴素贝叶斯进行文本分类
一、贝叶斯决策理论 给定一个点(x,y)要决定属于哪一个类别(类别1,类别2)我们一般的处理方法是: 如果:P1(x,y)>P2(x,y)类别为1 如果:P2(x,y)>P1(x,y)类别为2 这就是贝叶斯决策理论的核心思想——选择具有最高概率的决策。 二、条件概率 条件概率P(a|b)表示在事件b已经发生的情况下事件a出原创 2015-03-10 20:49:19 · 715 阅读 · 0 评论