机器学习
文章平均质量分 83
AIHGF
完美一切 一切完美
展开
-
机器学习 - 交叉熵Cross Entropy
机器学习 - 交叉熵Cross Entropy1. 二值交叉熵 Binary Cross Entropy假设训练数据 D={(x1,y1),(x2,y2),...,(xn,yn)}D={(x1,y1),(x2,y2),...,(xn,yn)}D = \{(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)\} ,其中x∈Rnx∈Rnx \in R^n ...原创 2018-04-13 14:59:35 · 9123 阅读 · 0 评论 -
流形学习manifold learning
原文地址:learning}">流形学习{manifold learning}作者:faruto以下资料均为网络查找的【转之】流形学习 假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。流形学习方法是模式转载 2014-03-11 16:46:51 · 1356 阅读 · 0 评论 -
VMware提示:此虚拟机似乎正在使用中,取得该虚拟机的所有权失败错误的解决方案
使用VMware的过程中,如果没有挂起和关闭虚拟机,实体机断电等直接关闭的话,会出现以下提示:---------------------------------------------------------------------------------------------------------------------此虚拟机似乎正在使用中。如果此虚拟机已在使用中,原创 2015-09-23 09:11:38 · 1567 阅读 · 0 评论 -
漫谈高数之特征向量物理意义
原文地址: 特征向量物理意义">漫谈高数 特征向量物理意义作者:百醉小仙什么是特征向量,特征值,矩阵分解[1. 特征的数学意义] 我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。我们可以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就转载 2014-03-11 16:45:11 · 1069 阅读 · 0 评论 -
计算机视觉代码合集
原文地址:Huang收集的计算机视觉代码合集">UIUC同学Jia-Bin Huang收集的计算机视觉代码合集作者:千里8848UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下:https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html这些代码很实用,可以让我们站在巨人的肩膀上~~转载 2014-03-11 16:46:35 · 1254 阅读 · 0 评论 -
窗函数(window function)
原文地址:function)">窗函数(window function)作者:了凡春秋窗函数是频谱分析中一个重要的部分,窗函数修正了由于信号的非周期性并减小了频谱中由于泄露而带来的测量不准确性。快速傅里叶变换假定了时间信号是周期无限的。但在分析时,我们往往只截取其中的一部分,因此需要加窗以减小泄露。窗函数可以加在时域,也可以加在频域上,但在时域上加窗更为普遍。截断效应带来了泄漏,窗函数是为了减小转载 2014-03-11 16:47:47 · 11757 阅读 · 1 评论 -
NMF(非负矩阵分解)算法
NMF,非负矩阵分解,它的目标很明确,就是将大矩阵分解成两个小矩阵,使得这两个小矩阵相乘后能够还原到大矩阵。而非负表示分解的矩阵都不包含负值。信息时代使得人类面临分析或处理各种大规模数据信息的要求,如卫星传回的大量图像、机器人接受到的实时视频流、数据库中的大规模文本、Web上的海量信息等。处理这类信息时,矩阵是人们最常用的数学表达方式,比如一幅图像就恰好与一个矩阵对应,矩阵中的每个位置存放着图原创 2014-03-11 16:49:09 · 2207 阅读 · 0 评论 -
相似性度量
转自:http://blog.csdn.net/zxia1/article/details/8624444在模式识别、计算机视觉等多个领域,都会涉及到相似性的度量这一问题,用来衡量不同对象间的差异性(距离)或相似性(相似度)。这里的对象可以是网页,图像,也可以是文本,集合,但最终在数学上都可以表示为向量或者向量的集合。对于不同大小的向量集合的相似性度量问题,这里先不展开讨论。对于相同长转载 2014-03-21 20:14:10 · 1738 阅读 · 0 评论 -
机器学习中的相似性度量
转自:http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的转载 2014-03-21 20:16:43 · 695 阅读 · 0 评论 -
low rank representation
去年已经开始在接触低秩表达,最近学习到一些paper,发现对这个还是不是很理解,今天从这里开始记录一下对低秩表达的学习。目前低秩表达主要用在子空间分割上,也就是给定一组数据,这组数据是从某几个子空间上来的,通过低秩表达可以达到对来自这几个子空间的数据进行聚类,可以找到哪些数据时来自具体的哪个子空间。首先子空间分割有很多种方法比如基于概率模型的(由于高斯分布最能代表一个子空间,所以一般基原创 2014-03-11 16:45:58 · 2245 阅读 · 0 评论 -
PCA基本推导和计算方法
原文地址:分解的基本推导和计算方法">PCA 分解的基本推导和计算方法作者:dengyafengPCA是数据降维的一种方法,其目标是找到数据分布方差最大的方向,并将数据向该方向投影并保持投影后恢复数据的残差最小。即找到e和a,使得x的估计值x‘=m+e*a与x残差最小。注意,这里e为一个方向向量(非矩阵),且限定e的模为1(否则a和e不唯一)。PCA的推导,通过最优化x-x’的均方误差最小,转载 2014-03-11 16:46:04 · 1204 阅读 · 0 评论 -
机器学习 - 如何交叉验证 PCA、聚类和矩阵分解模型
机器学习 - 如何交叉验证 PCA、聚类和矩阵分解模型[原文 - How to cross-validate PCA, clustering, and matrix decomposition models] 矩阵分解模型的交叉验证技巧,以 PCA 和聚类为例;并基于 Python 给于说明.1. 线性回归的交叉验证交叉验证是现代数据分析中的一种基础范式,普遍用于有监督的...翻译 2018-03-05 10:01:33 · 6499 阅读 · 0 评论 -
机器学习 - Data Augmentation 策略
Data Augmentation 策略数据增强是提高模型性能和泛化能力的重要方法.随机调整 - Random resize 平移 - Shift 水平/垂直翻转 - Horizontal/Vertical flip Rotation/Reflection 旋转/仿射变换Noise - 高斯噪声,模糊处理颜色增强 - Color Augmentation,包括色彩饱和度、亮度和...原创 2018-03-09 14:44:38 · 2137 阅读 · 0 评论 -
计算机视觉、机器学习相关领域论文
注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。最近一次更新注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。最近一次更新:2013-11-26一、特征提取FeatureExtraction:· SIFT[1] [Demo p原创 2014-03-11 16:48:09 · 873 阅读 · 0 评论 -
计算机视觉、机器学习相关领域论文
十一、目标、行为识别Object, ActionRecognition:· ActionRecognition by Dense Trajectories[Project][Code]· ActionRecognition Using a Distributed Representation of Pose andAppearance[Pro原创 2014-03-11 16:48:11 · 738 阅读 · 0 评论 -
机器学习 - 基于 Scikit-learn 多类别和多标签分类算法
Scikit-learn - Multiclass 和 Multilabel 算法针对多分类和多标签问题,虽然深度学习具有较好的表现,但采用传统机器学习方法可以作为对问题深入理解的尝试.sklearn.multiclass 提供了很多机器学习算法,处理 multiclass 和 multilabel分类问题,主要是将问题转化为二值分类(binary classification) 问题. ...原创 2018-02-01 18:20:21 · 10560 阅读 · 0 评论 -
机器学习 - 精度评价
机器学习 - 精度评价Python sklearn.metrics 提供了很多任务的评价指标,如分类任务的混淆矩阵、平均分类精度、每类分类精度、总体分类精度、F1-score 等;以及回归任务、聚类任务等多种内置函数.分类 - 混淆矩阵 Confusion Matrix原创 2018-01-16 15:21:29 · 1655 阅读 · 0 评论 -
机器学习 - 计算 Log-Sum-Exp
计算 Log-Sum-Exp[原文-Computing Log-Sum-Exp] 本文的计算技巧是有效的,但在机器学习课程上没有明确提到.假设 NN 个 值的数据集 {xn}Nn=1\{x_n\}_{n=1}^N,需要计算的值为:z=log∑Nn=1exp{xn}z = log \sum_{n=1} ^N exp\{x_n\}当采用 softmax 对 multinomial 分布进行参数化时翻译 2017-11-09 14:43:34 · 14809 阅读 · 4 评论 -
矩阵分解算法集合
原文地址:矩阵分解的Jungle,市面上的矩阵分解算法作者:loveLifeAwayWWW矩阵分解的Jungle2011年9月5日忙菇发表评论阅读评论美帝的有心人士收集了市面上的矩阵分解的几乎所有算法和应用,由于源地址在某神秘物质之外,特转载过来,源地址MatrixDecompositions has a long history andgenerally cen转载 2014-03-11 16:46:40 · 2768 阅读 · 0 评论 -
非负矩阵因式分解
转自:http://www.cnblogs.com/luosha/archive/2009/09/25/2571544.html转载 2014-06-04 21:53:28 · 1544 阅读 · 0 评论 -
关于NMF(Non-negative Matrix Factorization )
转自:http://fxy1211.blog.163.com/blog/static/68255322007826111015905/转载 2014-06-04 21:55:48 · 1209 阅读 · 0 评论 -
Jacobian矩阵和Hessian矩阵
转自:http://jacoxu.com/?p=1461. Jacobian在向量分析中, 雅可比矩阵是一阶偏导数以一定方式排列成的矩阵, 其行列式称为雅可比行列式. 还有, 在代数几何中, 代数曲线的雅可比量表示雅可比簇:伴随该曲线的一个代数群, 曲线可以嵌入其中. 它们全部都以数学家卡尔·雅可比(Carl Jacob, 1804年10月4日-1851年2月18日)命转载 2015-09-28 09:16:47 · 759 阅读 · 0 评论 -
高阶奇异值分解
原文地址:高阶奇异值分解作者:fanfan基于高阶奇异值分解的手写数字分类摘要在这篇文章中,我们提出了两个基于高阶奇异值分解(HOSVD)的手写数字分类的算法。第一个算法用HOSVD进行类模型的建立,使得分类结果的错误率小于6%。第二种算法用HOSVD同时在两个模型中进行张量近似。第二种算法在把原始数据减少约98%后,仍然使分类的错误率小于5%。两种算法在进行分类的检验阶段,都是通过一系列转载 2014-03-11 16:47:45 · 3321 阅读 · 0 评论 -
奇异值和特征值
原文地址:奇异值和特征值作者:记录定义特征值:一矩阵A作用与一向量a,结果只相当与该向量乘以一常数λ。即A*a=λa,则a为该矩阵A的特征向量,λ为该矩阵A的特征值。奇异值:设A为m*n阶矩阵,AHA的n个特征值的非负平方根叫作A的奇异值。记为σi(A)关系对于对称矩阵和 Hermite 矩阵而言,一个非负的特征值也是一个奇异值,相应的特征向量是相应的左右奇异向量。 几何意义转载 2014-03-11 16:46:54 · 1063 阅读 · 0 评论 -
矩阵分解的Jungle,市面上的…
原文地址:矩阵分解的Jungle,市面上的矩阵分解算法作者:loveLifeAwayWWW矩阵分解的Jungle2011年9月5日忙菇发表评论阅读评论美帝的有心人士收集了市面上的矩阵分解的几乎所有算法和应用,由于源地址在某神秘物质之外,特转载过来,源地址MatrixDecompositions has a long history andgenerally cen转载 2014-03-11 16:46:31 · 801 阅读 · 0 评论 -
适定、超定和欠定方程的概念
原文地址:适定、超定和欠定方程的概念作者:好习惯矩阵的每一行代表一个方程,m行代表m个线性联立方程。n列代表n个变量。如果m是独立方程数,根据mn确定方程是‘欠定’、‘适定’ 还是 ‘超定’。 超定方程组:方程个数大于未知量个数的方程组。 对于方程组Ra=y,R为n×m矩阵,如果R列满秩,且n>m超定方程一般是不存在解的矛盾方程。例如,如果给定的三点不在一条直线转载 2014-03-11 16:46:28 · 5845 阅读 · 0 评论 -
均方根误差与标准差
原文地址:均方根误差与标准差作者:昊楠标准差(std):标准差定义是观测值与其平均数偏差的平方和的平方根。它反映组内个体间的离散程度。均方根误差(Rmse):它是观测值与真值偏差的平方和观测次数n比值的平方根。 root-mean-square error, 均方根误差亦称标准误差,其定义为,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:√[di*2/(n-1)]=Re,转载 2014-03-11 16:46:22 · 2740 阅读 · 0 评论 -
SVD在推荐系统中的应用
参考自:http://www.igvita.com/2007/01/15/svd-recommendation-system-in-ruby/其实说参考也不准确,准确地说应该是半翻译半学习笔记。仔细整理一遍,感觉还是收获很大的。线性代数相关知识:任意一个M*N的矩阵A(M行*N列,M>N),可以被写成三个矩阵的乘机:1.U:(M行M列的列正交矩阵)2.S:(M*N的对角原创 2014-03-11 16:47:57 · 935 阅读 · 0 评论 -
拉普拉斯矩阵
原文地址:拉普拉斯矩阵作者:书山有路拉普拉斯矩阵图论的数学领域中的拉普拉斯矩阵(也被称为导纳矩阵,吉尔霍夫矩阵或离散拉普拉斯)是图的矩阵表示。 拉普拉斯矩阵 结合 吉尔霍夫理论可以用来计算图的最小生成树的个数。拉普拉斯矩阵还可用来寻找图的其他属性:谱图理论spectral graph theory. 黎曼几何的Cheeger不等式有涉及了拉普拉斯矩阵的离散模拟。这或许是谱图理论中最重转载 2014-03-11 16:48:13 · 4108 阅读 · 0 评论 -
深度优先搜索(DFS)的实现
转自:http://my.oschina.net/u/1785330/blog/287519摘要 深度优先搜索算法所遵循的搜索策略是尽可能“深”地搜索一个图。它的基本思想就是:首先访问图中某一起始顶点v,然后由v出发,访问与v邻接且未被 访问的任一顶点w1,再访问与w1邻接且未被访问的任一顶点w2,……重复上述过程。当不能再继续向下访问时,依次退回到最近被访问的顶点,若它还有邻接转载 2015-09-28 09:37:24 · 1150 阅读 · 0 评论 -
小波去噪
原文地址:小波去噪作者:gemutlich.cheng 在上交硕士论文《小波去噪在语音识别预处理中的应用》一文中,作者指出:语音信号中常见的噪声大致可以分为以下几类[1,2]:周期性噪声、脉冲噪声、宽带噪声和语音干扰噪声。周期性噪声的特点是有很多离散的窄谱峰,它往往是由汽车发动机和其他周期性运转机械以及电气干扰所引起的噪声。脉冲噪声通常来源于爆炸、撞击、放电及突发性干扰等,其特点是时转载 2014-03-11 16:49:23 · 1899 阅读 · 0 评论 -
几种常见的缺失数据插补方法
原文地址:几种常见的缺失数据插补方法作者:spss15.0(一)个案剔除法(Listwise Deletion) 最常见、最简单的处理缺失数据的方法是用个案剔除法(listwisedeletion),也是很多统计软件(如SPSS和SAS)默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话,就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话,这一方法十分有效。至于具体转载 2014-03-11 16:49:21 · 34828 阅读 · 0 评论 -
窗函数
数字信号处理中通常是取其有限的时间片段进行分析,而不是对无限长的信号进行测量和运算。具体做法是从信号中截取一个时间片段,然后对信号进行傅里叶变换、相关分析等数学处理。信号的截断产生了能量泄漏,而用FFT算法计算频谱又产生了栅栏效应,从原理上讲这两种误差都是不能消除的。在FFT分析中为了减少或消除频谱能量泄漏及栅栏效应,可采用不同的截取函数对信号进行截短,截短函数称为窗函数,简称为窗。泄漏与窗原创 2014-03-11 16:48:56 · 2229 阅读 · 0 评论 -
奇异值和特征值
原文地址:奇异值和特征值作者:记录定义特征值:一矩阵A作用与一向量a,结果只相当与该向量乘以一常数λ。即A*a=λa,则a为该矩阵A的特征向量,λ为该矩阵A的特征值。奇异值:设A为m*n阶矩阵,AHA的n个特征值的非负平方根叫作A的奇异值。记为σi(A)关系对于对称矩阵和 Hermite 矩阵而言,一个非负的特征值也是一个奇异值,相应的特征向量是相应的左右奇异向量。 几何意义转载 2014-03-11 16:46:19 · 1026 阅读 · 0 评论