- 博客(10)
- 资源 (1)
- 收藏
- 关注
转载 trace of matrix
trace 的一个十分重要的性质在于线性性,Tr(A+B)=Tr(A)+Tr(B)Tr(cA)=cTr(A)y=Hx+n 1. 基本性质Tr(A)=Tr(A^T) Tr(AB)=Tr(BA) Tr(ABC)=Tr(BCA)=Tr(CAB) 因此如果 A 和 C 互逆的话,三者相乘的 Trace,等于中间方阵的 Trace; 2. 拓展 试证明,注意这里用到一个性质
2018-01-25 23:39:15 3931
转载 西瓜书-answer- 第十章 降维与度量学习
http://blog.csdn.net/icefire_tyh/article/details/522430812.令err,err∗分别表示最近邻分类器与贝叶斯最优分类器的期望错误率,试证明:err∗≤err≤err∗(2−|Y||Y|−1∗err∗)。由书226页可知 err=1−∑c∈YP2(c|x) err∗=1−maxc∈YP(c|x) 设c∗=argmaxc∈YP(c|x)
2018-01-18 12:46:32 1990
转载 数据的标准化和中心化
简介: 意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。 原理:数据标准化:是指数值减去均值,再除以标准差; 数据中心化:是指变量减去它的均值。 目的:通过中心化和标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。在回归问题和一些机器学习算法中,以及训练神经网络的过程中,还有PCA等通常需要对原始数据进行中心化(Zero
2018-01-18 00:41:41 945
转载 度量学习
Wikipedia:http://www.cs.cornell.edu/~kilian/research/metric/metric.htmlCMU的Liu Yang总结的关于DML的综述页面。对DML的经典算法进行了分类总结,其中她总结的论文非常有价值,入门读物。:http://www.cs.cmu.edu/~liuy/distlearn.htmECCV 2010的turorial。 htt
2018-01-16 11:54:45 417
转载 神经网络方面的论文
一 RNN 1 Recurrent neural network based language model RNN用在语言模型上的开山之作2 Statistical Language Models Based on Neural Networks Mikolov的博士论文,主要将他在RNN用在语言模型上的工作进行串联3 Extensions of Recurrent Neur
2018-01-11 14:28:39 10582 1
转载 统计学基本概念:协方差矩阵
原文:http://www.cnblogs.com/chaosimple/p/3182157.html 理解协方差矩阵~~:同一数据集中的不同维度之间的关系一、统计学的基本概念 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有
2018-01-10 16:18:38 696
转载 机器学习—西瓜书-chapter3—对率回归
编程实现对率回归,并给出西瓜数据集3.0α上的结果对率函数是任意阶可导的凸函数,这是非常重要的性质。西瓜数据集3.0暂时不知道什么原因导致,结果差别这么大,记录下来。%matlab code%对率回归 西瓜数据集3.0ɑold_l=0; %记录上次计算的ln=0; %计算迭代次数b=[0;0;1]; %初始参数 (自定义)x = xlsread('E:
2018-01-10 12:50:05 1618
转载 机器学习基础-最大似然估计-贝叶斯模型
什么是参数?在机器学习中,我们经常使用一个模型来描述生成观察数据的过程。例如,我们可以使用一个随机森林模型来分类客户是否会取消订阅服务(称为流失建模),或者我们可以用线性模型根据公司的广告支出来预测公司的收入(这是一个线性回归的例子)。每个模型都包含自己的一组参数,这些参数最终定义了模型本身。我们可以把线性模型写成 y = mx + c 的形式。在广告预测收入的例子中,x 可以表示广告支出
2018-01-09 19:55:05 1880
转载 chapter-2-answer
2.1 题:数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。 答:留出法将数据集划分为两个互斥的集合,为了保持数据的一致性,应该保证两个集合中的类别比例相同。故可以用分层采样的方法。训练集包含350个正例与350个反例,测试集包含150个正例与150个反例。 故有500C350*500C3
2018-01-04 11:57:16 1742
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人