机器学习
Rolandxxx
An explorer
展开
-
线性方程组AX=b,AX=0以及非线性方程组的最小二乘解(解方程组->优化问题)
p=q表示A矩阵是个方阵,又因为是列满秩,所以是一个满秩的方阵,由于满秩的性质那么A的行列式不等于0。这时候Ax=y这个方程就很好求了,方程左右乘A的逆,就有唯一解了。:就是我们要求的q个变量x是互相无关的(没有向量可用有限个其他向量的线性组合所表示),必须要把这q个变量都求出来才行,不能说求出q-1个就能把q个变量决定。,这同时也说明了矩阵只适用于对X做线性变换的性质,对于做非线性变换的变换,矩阵表示不出来。,让X在满足条件的情况下使得║AX║的平方最小,于是就构造了一个带约束的最小二乘问题。原创 2022-08-29 16:13:31 · 10939 阅读 · 0 评论 -
充分理解判别模型和生成模型、概率模型和非概率模型
在理解完上面的文章后再看这篇博文,你就能够理解这篇文章中的公式,然后对判别模型,生成模型,概率模型,非概率模型的都能有足够清晰的认识。首先看这篇文章:作者从最基础的视角引入并讲解了概率模型和非概率模型(最后看这个:作者通过一个实际案例带你更加深刻认识概率与非概率模型。原创 2022-11-26 15:34:52 · 458 阅读 · 0 评论 -
关于分布的理解
指的是随机变量的分布,概率分布是指用于表述随机变量取值的概率规律。将随机变量作为横轴,概率作为纵轴,把随机变量与对应变量画上去,构成一个图形,这个图像就是概率分布的直观表示。其实我觉得如果要把机器学习中所说的分布看成概率分布,比如猫狗分类任务中的猫和狗就是两个随机变量,就可以把随机变量中的猫和狗抽象理解成他们各自特征向量的组合。数据分布可以理解为每一个特征是一个维度,所有样本在这些特征空间上的分布就是数据分布。2.得到这些值的概率分别是多少(对离散变量而言,对连续随机变量是得到给定区间值的概率)原创 2022-10-31 19:59:18 · 646 阅读 · 0 评论 -
均值方差归一化(Standardization)
首先减去均值就相当于把数据分布进行平移,即改变平均值。使数据的平均值都为0。这样并不会改变数据分布中各个点之间的距离。然后因为标准差可以理解为平均每个点距离平均值的距离,除以标准差就相当于以前平均每个点距离0的距离为S,现在变成了1。这样的话,对于数据中每个点的所有特征维度距离0的量纲就保持一致了。最后数据就都为均值为0,方差为1的正态分布了。英文也叫作Z-score Normalization,它是把所有数据归到均值为0,方差为1的分布中。即确保最终得到的数据均值为0,方差为1。...原创 2022-08-25 17:46:13 · 8672 阅读 · 0 评论