- 博客(88)
- 收藏
- 关注
原创 分类&回归算法-随机森林
随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。 算法思想解释: 在上述中,这些决策树好比是臭皮匠,森林就是臭皮匠的聚集之地。在分类中,倘若臭皮匠大
2015-11-03 14:35:46 35168 1
原创 PRML_决策论&信息论
决策论分类决策 在做决策的一个准则就是如何减少误分类损失: 如在而分类中,即把所属类别为c1的数据分到c2,把所属类别为c2的数据分到c1。 p(mistake)=∫R1p(x,c2)dx+∫R2p(x,c1)dxp(mistake) = \int_{\mathcal R_1}p(x,c_2)dx + \int_{\mathcal R_2}p(x,c_1)dx 用矩阵表示可以为: E
2015-09-25 11:52:43 829
原创 PRML第一章_概率论
1.2 概率论本节介绍了简单的概念:概率密度 现在有两个box,红的box里面有2个apples,6 oranges,蓝的box里面有3 apples,1 oranges。 进行有放回的选取,即bootstrap. p(B)指的就是从两个box中取到红box的概率 p(F)指的是取到apple的概率 1. 概率规则: sum rule: p(X)=∑Yp(X,Y)p(X) = \s
2015-09-25 11:44:32 753
原创 PRML第一章_易混淆概念-先验后验&生成判别&分类回归
先验概率和后验概率:例如先验概率是p(B),不需要给定的F,就可以得到的概率叫做先验概率。 后验概率是p(B|F),给定F之后,才得到的概率就叫做后验概率。生成和判别模型生成模型: 通过联合概率密度p(x,y),再间接根据 由数据学习联合概率密度分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:P(Y|X)= P(X,Y)/ P(X)。基本思想是首先建立样本的联合概
2015-09-25 11:41:10 686
原创 PRML第一章_易混淆概念-先验后验&生成判别&分类回归
先验概率和后验概率:例如先验概率是p(B),不需要给定的F,就可以得到的概率叫做先验概率。后验概率是p(B|F),给定F之后,才得到的概率就叫做后验概率。生成和判别模型生成模型:通过联合概率密度p(x,y),再间接根据由数据学习联合概率密度分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:P(Y|X)= P(X,Y)/ P(X)。基本思想是首先建
2015-09-25 11:39:36 647
原创 PRML第一章学习笔记_过拟合问题
第一章举了一个数字图像识别的例子来介绍了机器学习的几个重要概念:学习,训练集,测试集,监督学习,无监督学习,强化学习,回归,特征抽取,泛化性,等等。 1.1多项式拟合问题 我们很容易的想到了多项式拟合,这个是最naïve的想法。 y(x,w)=w0+w1x+w2x2+w3x3+...+wMxM=∑Mj=0wjxjy(x,w) = w_0 + w_1x + w_2x^2 + w_3x^3 +
2015-09-23 11:12:14 956
转载 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2015-09-23 11:07:29 489
原创 python 安装模块
例如安装模块pyexcelerator直接将pyexcelerator-0.6.4.1这个文件夹里的pyExcelerator文件夹复制到C:\Python27\Lib\site-packages文件夹下就可以使用
2015-01-06 20:27:33 644 1
转载 Matlab导出eps图形给latex使用
通常情况下对于IEEE模板,如果文章是占一列column,图形的宽度是3.5in(1in=2.54cm), 如果是2列,图形是7in通常情况下,字体可以用9或者10pt请按照如下步骤生成符号标准的eps图形:1.点击你的图形窗口—>Export Setup2.点击size, 填写3.5或者7,单位选择inch3.选择fonts,在minimum里面填入9
2014-10-25 21:36:53 2783
原创 python 读写mat文件
import scipy.io as sioimport matplotlib.pyplot as pltimport numpy as np#matlab文件名matfn=u'E:/python/测试程序/162250671_162251656_1244.mat'data=sio.loadmat(matfn)plt.close('all')xi=data['xi']yi=da
2014-09-13 19:32:06 726
原创 latex 数学公式
http://hubl82.blog.163.com/blog/static/12676948520134510173383/
2014-07-27 12:35:16 743 1
原创 mac中的Texshop中文乱码问题
参见博客第一种方法:http://blog.csdn.net/quantumpo/article/details/9317925先用着把,第二种方法会 出现缺少某些字体,
2014-07-26 19:54:58 9340 2
原创 主动学习文章_active learning by querying informative and representative examples
大部分的主动学习模型只考虑其中的一种,例如
2014-07-09 09:40:48 2417 1
原创 Active learning(主动学习)
主动学习假设:1、AL implicitly assumes that a large pool of unlabeled documents is availableand that querying this pool is cheap compared to labelingsince the latter takes a human expert’s time
2014-07-08 22:01:33 2531
原创 RNN-递归神经网络
pLearning continuous phrase representations and syntactic parsing with Recursive Neural Networks.pdf
2014-06-09 21:55:23 2042
原创 K-means(tri)利用三角不等式性质加速k-means
paper:Using the Triangle Inequality to Accelerate k-means公式1:x
2014-06-09 10:43:52 3702 1
原创 softmax
softmax是柔性化最大值,是一种归一操作,使得输出在(0,1)之间。举例来说a=3,b=6,c=9. max=9,softmax=9/(3+6+9)=0.5,argmax其实是取得max时的arg,argmax=c
2014-06-08 15:46:05 4535
原创 Using the Triangle Inequality to Accelerate k-Means
If a point is far away from a center, it is not necessary to calculate the exact distance between the point and the center.如果一个点距离中心很远,那么计算这个d
2014-06-01 22:10:46 878
转载 Efficient Estimation of Word Representations in Vector Space
标题:Efficient Estimation of Word Representations in Vector Space作者:Tomas Mikolov发表于:ICLR 2013
2014-06-01 12:21:05 1486
原创 An Analysis of Single-Layer Networks in Unsupervised Feature Learning
K-means:http://metaoptimize.com/qa/questions/4964/why-does-k-means-generate-such-good-features-especially-compared-to-gmmIn the paper above, Ng's group uses K-means for dictionary learning; that
2014-06-01 12:15:45 1125
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人