自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 2015-05-05

认知、流形与虚实世界 - Zero2One .post p {text-indent: 2em;}.post li p, .post ol p, .post ul p, .post blockquote p{text-indent: 0em}@media (max-width: 480px){ .post p img:first-child {margin-left:-2em} }

2015-07-01 09:49:54 680

原创 熵各个概念的直观理解

信息熵其实解决的问题是信息量应该怎么量化,它的公式是        H =-(p1log2(p1)+p2log2(p2)+…..pnlog2(pn)这个公式的含义是什么呢,举一个数学之美上的例子,马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”?他不愿意直接告诉我,而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对

2015-04-26 11:26:21 622

原创 生成学习模型概述

在有监督学习里,总的来说有两种学习模型,第一种是判别学习模型,它直接针对我们给的数据,找出不同类数据在特征上的不同,更形象点说,就是直接在特征空间内画圈圈三角形之类的,把不同的类别给分开。第二种是生成学习模型,它的目的是为啦找到数据究竟是肿么生成的,它背后的机理是什么?有一种就是从概率的角度研究数据的生成方式,说的有点虚,实际点就是求特征和类标签的联合概率分布,然后通过比较最大后验概率的形式得出最

2015-04-25 13:51:32 927

原创 论文读后感,关于机器学习实践过程中应该注意的问题

越简单越好,是建立在模型同等解释力度的基础上的。数据泄露的问题,评估的时候不能用测试数据去优化模型,或则说一般而言,不能即做测试有做训练(但是有那种预测完后回馈改进的模型存在)抽样偏差,意思就是务必满足独立同分布,对训练集来说对于一个具体的机器学习任务而言,当我们数据比较少的时候,没得说,合理的方法是一个一个试各种模型,对它们的效果进行比较后再选取最佳模型,但是如果数据量比较大,显

2015-03-03 09:43:34 453

转载 生成模型和判别模型的区别

生成模型与判别模型 一、决策函数Y=f(X)或者条件概率分布P(Y|X)       监督学习的任务就是从数据中学习一个模型(也叫分类器),应用这一模型,对给定的输入X预测相应的输出Y。这个模型的一般形式为决策函数Y=f(X)或者条件概率分布P(Y|X)。       决策函数Y=f(X):你输入一个X,它就输出一个Y,这个Y与一个阈值比较,根据比较结果判定X属于哪个类别。例如两类(w

2015-02-05 10:07:39 508

原创 机器学习,我们需要注意什么

以下是我对 A  Few Useful Things to Knowabout Machine Learning这篇论文中涉及的几个topic的看法。1.   Learning = representation +evaluation + optimization如果说让我用一句话描述机器学习算法是怎样执行的,我会说: 机器学习算法是在它假设的模型空间(hypothesis space)中

2015-01-27 10:27:42 656

原创 多标记学习

什么是多标记学习呢?对于传统的分类器,分类器的工作是把新来的数据实例根据它的特征贴上一个类标记,如果说这个类标记的取值空间只有两个,那么它就是二元分类,如果是多个就是多元分类。而多标记学习呢,则是给数据实例贴上许多个不同的类标记。然后多标记学习应用也很广泛,比如说一篇文章,它可能属于言情呀,武侠呀等等多个主题。再比如说一种蛋白质对人体而言会有很多种作用等等,这些都是多标记学习的应用。还有一点,我们

2014-12-26 16:51:01 7418

原创 感知机

1.    为什么叫感知机当我第一次看到这个名词的时候 perception,顿时有种很厉害的感觉,但发现它其实只是一个二元的线性分类模型。然后我就在想它和感知机有毛线关系哇。好吧,我只能说它是在1950s由Frank Rosenblatt第一次引入的一个最简单的单层神经网络模型,它非常厉害的模拟啦人脑的这种分层思考的模型,所以有个厉害的名字——感知机,就是这样。And由于这种非常厉害的模拟,

2014-12-11 11:53:18 2216

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除