![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
西瓜书
糖糖糖-豆
chemistry_master
展开
-
西瓜书配套习题第一章
http://blog.csdn.net/wzmsltw/article/details/50771377 原贴2.1题:数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。答:留出法将数据集划分为两个互斥的集合,为了保持数据的一致性,应该保证两个集合中的类别比例相同。故可以用分层采样的方法。训转载 2017-10-25 15:22:02 · 1149 阅读 · 0 评论 -
机器学习—西瓜书-chapter3—对率回归
编程实现对率回归,并给出西瓜数据集3.0α上的结果对率函数是任意阶可导的凸函数,这是非常重要的性质。西瓜数据集3.0暂时不知道什么原因导致,结果差别这么大,记录下来。%matlab code%对率回归 西瓜数据集3.0ɑold_l=0; %记录上次计算的ln=0; %计算迭代次数b=[0;0;1]; %初始参数 (自定义)x = xlsread('E:转载 2018-01-10 12:50:05 · 1598 阅读 · 0 评论 -
trace of matrix
trace 的一个十分重要的性质在于线性性,Tr(A+B)=Tr(A)+Tr(B)Tr(cA)=cTr(A)y=Hx+n 1. 基本性质Tr(A)=Tr(A^T) Tr(AB)=Tr(BA) Tr(ABC)=Tr(BCA)=Tr(CAB) 因此如果 A 和 C 互逆的话,三者相乘的 Trace,等于中间方阵的 Trace; 2. 拓展 试证明,注意这里用到一个性质转载 2018-01-25 23:39:15 · 3887 阅读 · 0 评论 -
矩阵的导数与trace
转载https://www.cnblogs.com/crackpotisback/p/5545708.html转载 2018-01-26 00:06:21 · 500 阅读 · 0 评论 -
西瓜书-answer- 第十章 降维与度量学习
http://blog.csdn.net/icefire_tyh/article/details/522430812.令err,err∗分别表示最近邻分类器与贝叶斯最优分类器的期望错误率,试证明:err∗≤err≤err∗(2−|Y||Y|−1∗err∗)。由书226页可知 err=1−∑c∈YP2(c|x) err∗=1−maxc∈YP(c|x) 设c∗=argmaxc∈YP(c|x)转载 2018-01-18 12:46:32 · 1979 阅读 · 0 评论 -
数据的标准化和中心化
简介: 意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。 原理:数据标准化:是指数值减去均值,再除以标准差; 数据中心化:是指变量减去它的均值。 目的:通过中心化和标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。在回归问题和一些机器学习算法中,以及训练神经网络的过程中,还有PCA等通常需要对原始数据进行中心化(Zero转载 2018-01-18 00:41:41 · 927 阅读 · 0 评论 -
度量学习
Wikipedia:http://www.cs.cornell.edu/~kilian/research/metric/metric.htmlCMU的Liu Yang总结的关于DML的综述页面。对DML的经典算法进行了分类总结,其中她总结的论文非常有价值,入门读物。:http://www.cs.cmu.edu/~liuy/distlearn.htmECCV 2010的turorial。 htt转载 2018-01-16 11:54:45 · 405 阅读 · 0 评论 -
chapter-2-answer
2.1 题:数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。 答:留出法将数据集划分为两个互斥的集合,为了保持数据的一致性,应该保证两个集合中的类别比例相同。故可以用分层采样的方法。训练集包含350个正例与350个反例,测试集包含150个正例与150个反例。 故有500C350*500C3转载 2018-01-04 11:57:16 · 1727 阅读 · 0 评论 -
统计学基本概念:协方差矩阵
原文:http://www.cnblogs.com/chaosimple/p/3182157.html 理解协方差矩阵~~:同一数据集中的不同维度之间的关系一、统计学的基本概念 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有转载 2018-01-10 16:18:38 · 671 阅读 · 0 评论