模式识别
koko_TT
Show me the code.
展开
-
独立和不相关 区别及形象理解
引独立与不相关是一个随机过程中随机变量可能具有的两个特性。这里先给出两者关系定义:若独立则必然不相关,即有独立=>不相关(条件符号不可反)若不相关则不一定独立形象理解理解:对于二维坐标来说,如果x与y独立那么就是即便知道了x,任何时候无法确定y,而不相关则不是这样。在圆中均匀分布了无数个点,无法得出x与y互相变化影响的具体关系,则他们是不相关的,但不能说是...原创 2019-02-28 14:48:51 · 18599 阅读 · 1 评论 -
利用PCA对数据降维并处理Iris数据集(附Python代码)
PCA步骤假设数据的存储方式为,每一行一个样本,每一列一个特征,这符合绝大多数我们处理的数据的形式。去均值化,将数据datarows,colsdata_{rows, cols}datarows,cols的每一列减去其自身列的均值,即每一组特征减去该组特征的均值。求协方差矩阵,这里的data是上一步去均值化后的数据矩阵,nsamplesn_{samples}nsamples是样本的个数,...原创 2019-04-12 10:51:56 · 9824 阅读 · 1 评论 -
PCA与SVD降维的结果比较(以Iris数据集为例)(附Python代码)
比较结果左上:原始数据的前两维特征。右上:利用Sklearn库函数decomposition.PCA()对原数据进行PCA后,取前两个维度的特征。左下:按照PCA的步骤对数据进行处理得到结果,并前两个维度特征。这里已经对结果取负,具体步骤参考利用PCA对Iris数据集降维。右下:直接对去均值化后的原始数据进行SVD分解,即dataremove−mean=U∗Σ∗VTdata_{remove...原创 2019-04-15 16:52:24 · 2998 阅读 · 0 评论 -
多元线性回归与梯度下降法原理及公式推导(附Python代码)
引以线性方程为例,设有线性方程:ytrue=θ0+θ1x1+θ2x2…+θnxny_{true} = \theta_0 + \theta_1x_1 + \theta_2x_2…+ \theta_nx_nytrue=θ0+θ1x1+θ2x2…+θnxn如果现在我们手头上已经有了N组数据,其中第iii组数据为[xi,1xi,2xi,3…xi,n][x_{i,1} x_{i,2} ...原创 2019-04-03 10:26:47 · 15062 阅读 · 8 评论 -
数据的标准化与归一化
标准化与归一化的方法标准化:即是将数据处理为均值为0,标准差为1的形式。result=x−x.mean()x.std()result = \frac{x - x.mean()}{x.std()}result=x.std()x−x.mean()归一化将数据处理为分布在[0,1][0, 1][0,1]的范围。result=x−x.min()x.max()−x.min(...原创 2019-04-15 21:48:50 · 264 阅读 · 0 评论