2018年01月_糖糖糖-豆

10月 07月 05月 03月 02月 01月

转载矩阵的导数与trace

转载https://www.cnblogs.com/crackpotisback/p/5545708.html

2018-01-26 00:06:21 508

转载 trace of matrix

trace 的一个十分重要的性质在于线性性，Tr(A+B)=Tr(A)+Tr(B)Tr(cA)=cTr(A)y=Hx+n 1. 基本性质Tr(A)=Tr(A^T) Tr(AB)=Tr(BA) Tr(ABC)=Tr(BCA)=Tr(CAB) 因此如果 A 和 C 互逆的话，三者相乘的 Trace，等于中间方阵的 Trace； 2. 拓展试证明，注意这里用到一个性质

2018-01-25 23:39:15 3931

转载西瓜书-answer- 第十章降维与度量学习

http://blog.csdn.net/icefire_tyh/article/details/522430812.令err,err∗分别表示最近邻分类器与贝叶斯最优分类器的期望错误率，试证明：err∗≤err≤err∗(2−|Y||Y|−1∗err∗)。由书226页可知 err=1−∑c∈YP2(c|x) err∗=1−maxc∈YP(c|x) 设c∗=argmaxc∈YP(c|x)

2018-01-18 12:46:32 1990

转载数据的标准化和中心化

简介：意义：数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。原理：数据标准化：是指数值减去均值，再除以标准差；数据中心化：是指变量减去它的均值。目的：通过中心化和标准化处理，得到均值为0，标准差为1的服从标准正态分布的数据。在回归问题和一些机器学习算法中，以及训练神经网络的过程中，还有PCA等通常需要对原始数据进行中心化（Zero

2018-01-18 00:41:41 945

转载度量学习

Wikipedia:http://www.cs.cornell.edu/~kilian/research/metric/metric.htmlCMU的Liu Yang总结的关于DML的综述页面。对DML的经典算法进行了分类总结，其中她总结的论文非常有价值，入门读物。:http://www.cs.cmu.edu/~liuy/distlearn.htmECCV 2010的turorial。 htt

2018-01-16 11:54:45 417

转载神经网络方面的论文

一 RNN 1 Recurrent neural network based language model RNN用在语言模型上的开山之作2 Statistical Language Models Based on Neural Networks Mikolov的博士论文，主要将他在RNN用在语言模型上的工作进行串联3 Extensions of Recurrent Neur

2018-01-11 14:28:39 10582 1

转载统计学基本概念：协方差矩阵

原文：http://www.cnblogs.com/chaosimple/p/3182157.html 理解协方差矩阵~~：同一数据集中的不同维度之间的关系一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先，我们给定一个含有n个样本的集合，下面给出这些概念的公式描述：均值：标准差：方差：均值描述的是样本集合的中间点，它告诉我们的信息是有

2018-01-10 16:18:38 696

转载机器学习—西瓜书-chapter3—对率回归

编程实现对率回归，并给出西瓜数据集3.0α上的结果对率函数是任意阶可导的凸函数，这是非常重要的性质。西瓜数据集3.0暂时不知道什么原因导致，结果差别这么大，记录下来。%matlab code%对率回归西瓜数据集3.0ɑold_l=0; %记录上次计算的ln=0; %计算迭代次数b=[0;0;1]; %初始参数（自定义）x = xlsread('E:

2018-01-10 12:50:05 1618

转载机器学习基础-最大似然估计-贝叶斯模型

什么是参数？在机器学习中，我们经常使用一个模型来描述生成观察数据的过程。例如，我们可以使用一个随机森林模型来分类客户是否会取消订阅服务（称为流失建模），或者我们可以用线性模型根据公司的广告支出来预测公司的收入（这是一个线性回归的例子）。每个模型都包含自己的一组参数，这些参数最终定义了模型本身。我们可以把线性模型写成 y = mx + c 的形式。在广告预测收入的例子中，x 可以表示广告支出

2018-01-09 19:55:05 1880

转载 chapter-2-answer

2.1 题：数据集包含1000个样本，其中500个正例，500个反例，将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估，试估算共有多少种划分方式。答：留出法将数据集划分为两个互斥的集合，为了保持数据的一致性，应该保证两个集合中的类别比例相同。故可以用分层采样的方法。训练集包含350个正例与350个反例，测试集包含150个正例与150个反例。故有500C350*500C3

2018-01-04 11:57:16 1742

机器学习实战代码实例

《机器学习实战》是2013年由人民邮电出版社出版的书籍，作者是Peter Harrington。本资源是该书配套的代码实例。

2017-10-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人