峰峰517-CSDN博客

转载 2015-05-05

认知、流形与虚实世界 - Zero2One .post p {text-indent: 2em;}.post li p, .post ol p, .post ul p, .post blockquote p{text-indent: 0em}@media (max-width: 480px){ .post p img:first-child {margin-left:-2em} }

2015-07-01 09:49:54 680

原创熵各个概念的直观理解

信息熵其实解决的问题是信息量应该怎么量化，它的公式是 H =-(p1log2(p1)+p2log2(p2)+…..pnlog2(pn)这个公式的含义是什么呢，举一个数学之美上的例子，马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯，赛后我问一个知道比赛结果的观众“哪支球队是冠军”？他不愿意直接告诉我，而要让我猜，并且我每猜一次，他要收一元钱才肯告诉我是否猜对

2015-04-26 11:26:21 622

在有监督学习里，总的来说有两种学习模型，第一种是判别学习模型，它直接针对我们给的数据，找出不同类数据在特征上的不同，更形象点说，就是直接在特征空间内画圈圈三角形之类的，把不同的类别给分开。第二种是生成学习模型，它的目的是为啦找到数据究竟是肿么生成的，它背后的机理是什么？有一种就是从概率的角度研究数据的生成方式，说的有点虚，实际点就是求特征和类标签的联合概率分布，然后通过比较最大后验概率的形式得出最

2015-04-25 13:51:32 927

原创论文读后感，关于机器学习实践过程中应该注意的问题

越简单越好，是建立在模型同等解释力度的基础上的。数据泄露的问题,评估的时候不能用测试数据去优化模型，或则说一般而言，不能即做测试有做训练（但是有那种预测完后回馈改进的模型存在）抽样偏差，意思就是务必满足独立同分布，对训练集来说对于一个具体的机器学习任务而言，当我们数据比较少的时候，没得说，合理的方法是一个一个试各种模型，对它们的效果进行比较后再选取最佳模型，但是如果数据量比较大，显

2015-03-03 09:43:34 453

转载生成模型和判别模型的区别

生成模型与判别模型一、决策函数Y=f(X)或者条件概率分布P(Y|X) 监督学习的任务就是从数据中学习一个模型（也叫分类器），应用这一模型，对给定的输入X预测相应的输出Y。这个模型的一般形式为决策函数Y=f(X)或者条件概率分布P(Y|X)。决策函数Y=f(X)：你输入一个X，它就输出一个Y，这个Y与一个阈值比较，根据比较结果判定X属于哪个类别。例如两类（w

2015-02-05 10:07:39 508

原创机器学习，我们需要注意什么

以下是我对 A Few Useful Things to Knowabout Machine Learning这篇论文中涉及的几个topic的看法。1. Learning = representation +evaluation + optimization如果说让我用一句话描述机器学习算法是怎样执行的，我会说：机器学习算法是在它假设的模型空间（hypothesis space）中

2015-01-27 10:27:42 656

原创多标记学习

什么是多标记学习呢？对于传统的分类器，分类器的工作是把新来的数据实例根据它的特征贴上一个类标记，如果说这个类标记的取值空间只有两个，那么它就是二元分类，如果是多个就是多元分类。而多标记学习呢，则是给数据实例贴上许多个不同的类标记。然后多标记学习应用也很广泛，比如说一篇文章，它可能属于言情呀，武侠呀等等多个主题。再比如说一种蛋白质对人体而言会有很多种作用等等，这些都是多标记学习的应用。还有一点，我们

2014-12-26 16:51:01 7418

原创感知机

1. 为什么叫感知机当我第一次看到这个名词的时候 perception，顿时有种很厉害的感觉，但发现它其实只是一个二元的线性分类模型。然后我就在想它和感知机有毛线关系哇。好吧，我只能说它是在1950s由Frank Rosenblatt第一次引入的一个最简单的单层神经网络模型，它非常厉害的模拟啦人脑的这种分层思考的模型，所以有个厉害的名字——感知机，就是这样。And由于这种非常厉害的模拟,

2014-12-11 11:53:18 2216

huangfeng1993的专栏