数学
红豆和绿豆
这个作者很懒,什么都没留下…
展开
-
特征值和特征向量的几何意义、计算及其性质
http://www.cnblogs.com/chaosimple/p/3179695.html一、特征值和特征向量的几何意义特征值和特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍是同维数的一个向量。因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量。那么变换的转载 2016-03-02 14:17:23 · 3288 阅读 · 0 评论 -
R语言与非参数统计(核密度估计)
R语言与非参数统计(核密度估计)核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。 假设我们有n个数X1-Xn,我们要计算某一个数X的概率密度有多大。核密度估计的方法是这样的:转载 2016-03-07 11:08:37 · 16848 阅读 · 1 评论 -
层次聚类之高斯混合模型聚类算法原理的介绍
单高斯分布模型GSM多维变量X服从高斯分布时,它的概率密度函数PDF为:x是维度为d的列向量,u是模型期望,Σ是模型方差。在实际应用中u通常用样本均值来代替,Σ通常用样本方差来代替。很容易判断一个样x本是否属于类别C。因为每个类别都有自己的u和Σ,把x代入(1)式,当概率大于一定阈值时我们就认为x属于C类。从几何上讲,单高斯分布模型在二维空间应该近似于椭圆,在三原创 2016-03-06 10:43:36 · 3117 阅读 · 0 评论 -
文本挖掘之降维技术之特征抽取之非负矩阵分解(NMF)
通常的矩阵分解会把一个大的矩阵分解为多个小的矩阵,但是这些矩阵的元素有正有负。而在现实世界中,比如图像,文本等形成的矩阵中负数的存在是没有意义的,所以如果能把一个矩阵分解成全是非负元素是很有意义的。在NMF中要求原始的矩阵的所有元素的均是非负的,那么矩阵可以分解为两个更小的非负矩阵的乘积,这个矩阵有且仅有一个这样的分解,即满足存在性和唯一性。 Contents转载 2016-03-03 20:53:41 · 7491 阅读 · 1 评论 -
文本分类之降维技术之特征抽取之SVD矩阵的分解的原理的介绍
http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html一、奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法。两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的都是一样,就是提取出一个矩阵最重要的特征。先谈谈特征值分解吧:转载 2016-03-02 18:29:58 · 4072 阅读 · 1 评论 -
奇异值与潜在语义索引LSI
http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html潜在语义索引(Latent Semantic Indexing)与PCA不太一样,至少不是实现了SVD就可以直接用的,不过LSI也是一个严重依赖于SVD的算法,之前吴军老师在矩阵计算与文本处理中的分类问题中谈到: “三个矩阵转载 2016-03-03 12:12:30 · 792 阅读 · 0 评论 -
文本挖掘之降维之特征抽取之主成分分析(PCA)
PCA的原理原创 2016-03-02 10:49:22 · 5697 阅读 · 0 评论 -
PCA使用SVD解决
http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html 主成分分析在上一节里面也讲了一些,这里主要谈谈如何用SVD去解PCA的问题。PCA的问题其实是一个基的变换,使得变换后的数据有着最大的方差。方差的大小描述的是一个变量的信息量,我们在讲一个东西的稳定性的时候,往往说要减小方差,如果一个模转载 2016-03-02 18:48:30 · 3329 阅读 · 0 评论 -
文本分类之降维技术之特征抽取之LDA线性判别分析
特征抽取方法则可以看作从测量空间到特征空间的一种映射或变换,一般是通过构造一个特征评分函数,把测量空间的数据投影到特征空间,得到在特征空间的值,然后根据特征空间中的值抽取最高的若干个特征。 常用的特征抽取方法主要有主成分分析(PCA)、潜在语义索引、非负矩阵分解等。原创 2016-03-02 09:06:44 · 7758 阅读 · 1 评论 -
抽样方法
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取使总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。随机抽样编辑简介(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总体中逐个抽取;优点:操作简便易行缺点:总体过大不易实行方法转载 2016-04-01 20:06:10 · 1521 阅读 · 0 评论