- 博客(3)
- 收藏
- 关注
原创 PCA主成分分析要点
方差表示是数据间的多样性程度。https://zhuanlan.zhihu.com/p/35654077 求投影后的方差最大通过拉格朗日乘子法求导求极值等价成求协方差矩阵的特征值,求得的特征向量都可以作为线性变换后新空间的基向量,且他们是正交的。若要降到k维,主成分就是协方差矩阵的前k个主特征向量,将原数据X的每个样本(或者说整个X)分别与k个特征向量(投影向量)做内积,得到降维后的数据。 特征向量在线性变换后仍然处在原向量张成的空间上,特征值是特征向量相对于原来向量的缩放比例。 ...
2021-08-16 15:38:23
54
原创 ICA独立成分分析个人理解
隐含变量模型 x:观测信号,A:混合矩阵,s:独立成分、源信号、隐含变量 [模型假设]1, si之间是统计独立的(s1的取值对s2的取值没有提供信息,互不干连;不相关指不存在线性关系,不排除存在其他关系);2, si服从非高斯分布; 3, 混合矩阵可逆 D(x)=E[x-E(x)]2 多个独立的自由变量的和近似服从高斯分布&源信号是不服从高斯分布的=>利用观测信号分解量的非高斯性最大化来求源信号的近似,即IC 不适用于高斯分布是因为寻找IC正是利用了非高斯性的最大化 ...
2021-08-06 22:51:23
137
原创 KDE核密度估计理解
记录下对知乎回答https://www.zhihu.com/question/27301358的个人理解 对连续分布函数而言,概率/分布密度函数是分布函数的导数。 直方图中,所有直方图的面积(高:密度 X 底:x带宽)和为1;对应的,若是密度曲线,则关于x的积分为1 下式采用了极限逼近的思想,只要h够小, 求的是x这一点处,所以除以区间长度2h。因此方法上本质要求h趋于无穷小。但考虑到样本的随机性(单次试验),h取太小会导致方差大;h取太大,不能很好的代表x这一点,会导致误差大。 如果记(这里
2021-08-05 22:13:58
583
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人