机器学习算法
文章平均质量分 88
大兔齐齐
现担任苏宁易购数据总监;曾就职于阿里巴巴;对内容生成,算法变现,推荐营销等很感兴趣
展开
-
机器学习常见分类算法汇总
机器学习常见算法分类汇总转载自http://blog.csdn.net/cuifengqinghan/article/details/35612997机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算转载 2015-05-10 14:55:34 · 1340 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(七)
最优间隔分类器回想前面我们提到我们的目标是寻找一个超平面,使得离超平面比较近的点能有更大的间距。也就是我们不考虑所有的点都必须远离超平面,我们关心求得的超平面能够让所有点中离它最近的点具有最大间距。形象的说,我们将上面的图看作是一张纸,我们要找一条折线,按照这条折线折叠后,离折线最近的点的间距比其他折线都要大。形式化表示为: 这里用||w||=1规约w,使得wTx+b是几何原创 2015-05-25 14:28:15 · 887 阅读 · 0 评论 -
无约束最优化方法——牛顿法、拟牛顿法、BFGS、LBFGS
转自http://blog.csdn.net/lansatiankongxxc/article/details/45873597这是前一段时间写的博客,然后又重新整理了一下最速下降法牛顿法拟牛顿法SR1BFGSDFPLBFGS【最速下降法】无约束最优化方法不涉及约束条件,所以都是介绍如何寻找搜索方向以及搜索步长。 无约束最优化问题的目标函转载 2015-05-25 14:17:17 · 2533 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(九)
本次课程主要讲述了模型评估与模型选择的一些东西这次的课程笔记就不再敲公式了,主要是理解统计学习的目的是使学到的模型不仅对已知数据而且对未知数据都能有很好的预测能力,不同的学习方法会给出不同的模型,当损失函数给定时,基于损失函数的模型的训练误差和模型的测试误差就自然称为学习方法的评估标准。注意,统计学习方法具体采用的损失函数未必是评估时使用的损失函数,当然,让两者一致是比较理想的。训练误原创 2015-06-02 19:29:38 · 727 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(八)
原创 2015-06-02 14:42:29 · 676 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(十)
规则化和模型选择两个问题的引入:模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以使用多项式回归。那么使用哪种模型好呢?参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重W公式里的参数?假设可选的模型集合是M={M1,M2,...Md},比如我们想分类,那么SVM、logistic回归、神经网络等模型都包含原创 2015-06-02 19:45:23 · 958 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(十一)
原创 2015-06-21 10:07:36 · 1003 阅读 · 0 评论 -
Andrew NG 机器学习课程笔记(五)
生成学习算法本次课Andrew老师主要讲述了生成学习算法的定义,并详细描述了高斯判别分析的例子。之后对比了生成学习算法和判别学习算法的不同,介绍了一个适合对文本分类的算法,朴素贝叶斯。并借此介绍了一种平滑技术——拉普拉斯平滑。生成学习算法的定义:这里借用李航博士《统计学习方法》中的一段话生成方法由数据学习联合概率分布P(x,y),然后求出条件概率分布P(Y|X)作为原创 2015-05-16 23:08:59 · 1418 阅读 · 0 评论 -
KNN算法及其实现
K邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者原创 2015-05-20 21:29:45 · 1259 阅读 · 0 评论 -
Andrew NG机器学习课程笔记(六)
支持向量机(1)1.这一节Andrew老师回顾了上一节的朴素贝叶斯,然后提了下神经网络,接着就是重头戏支持向量机了。支持向量机是一种二分类模型,他的基本模型时定义在特征空间上的间隔最大的线性分类器,间隔最大使他有别于感知机,支持向量机还包括核技巧,这使他成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题。支持向量机的学习算法是求解凸二次原创 2015-05-20 20:33:06 · 1031 阅读 · 0 评论 -
Andrew NG 机器学习课程笔记(四)
牛顿法以及广义线性模型 1.牛顿法 之前使用的解最大似然估计的方法是梯度上升法,本节课讲了牛顿法,这使得结果能够迅速收敛NG老师上来从求解f(theta)=0这个方程开始讲起,如果想找到零点,我们可以采取下面的策略: 如上图所示,蓝色的曲线是f(theta),横坐标是theta,纵坐标是f(theta),1这个点处对应的X是theta的初值(自己赋的原创 2015-05-13 19:45:59 · 1172 阅读 · 0 评论 -
Andrew NG 机器学习课程笔记(三)
欠拟合与过拟合、局部加权回归、logistic回归 1.欠拟合与过拟合当假设空间含有不同复杂度(例如,不同的参数个数)的模型时,就要面临模型选择的问题,我们希望选择或学习一个合适的模型。如果在假设空间中存在“真模型”,那么选择的模型应该逼近真模型。具体的,所选择的模型要与真模型的参数个数相同,所选择的模型的参数向量与真模型的参数向量相近。如果一味的追求提高对训练数据的预测能力原创 2015-05-12 20:35:41 · 1713 阅读 · 4 评论 -
Andrew NG 机器学习课程笔记(二)
监督学习应用——线性回归、批梯度下降、随机梯度下降、标准方程推导 Andrew 首先从第一课提到的房子的大小和房价的数据入手介绍监督学习的应用,可以以一条直线去拟合这些数据,然后对于未知价格的房子,就可以带入这条直线的方程得到价格的预估。这里介绍了在机器学习算法中常用的几种表示符号,X代表输入,Y代表输出,m代表样本的个数,就代表了第i个样本的输入和输出。原创 2015-05-11 15:59:25 · 1391 阅读 · 1 评论 -
Andrew NG 机器学习课程笔记(一)
机器学习的动机与应用题记: 之前看过Andrew Ng的机器学习课程,但没有系统的整理与归纳,现在感觉有些东西遗忘了,于是准备每天花一些时间重温一下同时争取每天整理一节课的笔记,由于很多内容是自己理解或者在网上寻找各种资料得出的结论,难免有不足之处,还望读者指正。 今天是母亲节,祝天下的妈妈们节日快乐!祝自己的母亲天天开心,儿子会尽快领着儿原创 2015-05-10 20:33:49 · 1545 阅读 · 0 评论 -
阿里天池大数据之移动推荐算法大赛总结及代码全公布
移动推荐算法比赛已经结束了一个多星期了,现在写一篇文章来回顾一下自己的参赛历程。首先,对不了解这个比赛的同学们介绍一下这个比赛(引用自官网):赛题简介2014年是阿里巴巴集团移动电商业务快速发展的一年,例如2014双11大促中移动端成交占比达到42.6%,超过240亿元。相比PC时代,移动端网络的访问是随时随地的,具有更丰富的场景数据,比如用户的位置信息、用户访问的时间规律等。本次原创 2015-07-10 20:05:03 · 38499 阅读 · 6 评论