svd奇异值分解_SVD奇异值分解的直观例子

看书和bilibili的视频都很难找到关于SVD的形象化解释,好在

https://www.youtube.com/watch?v=P5mlg91as1c​www.youtube.com

这个视频做到了,最近正好还在看这个哥哥的图算法课程

先说SVD的概念,公式:

其中:

是一个m*n维的矩阵(比如m行代表M个文档,n列代表稀疏标识的单词)

是左奇异向量(Left Singular Vectors),m*r维矩阵(m个文档,r个概念?)

代表奇异值,是一个r*r的对角居正,每一行代表概念的强弱,r代表矩阵A的rank.

又奇异向量,n*r维,n个单词,r个概念。

facac09d9042fd9aa52f154c5b860467.png

接下去是一个图形分解例子,可以有两种表达方式:

6b2afd819b7303a92e52262ad8378f48.png

b713937e4267a17c388e91b8dd1324b5.png

一些SVD 的性质:

总可以找到实数矩阵A的奇异值分解式子,并且:

1.

是唯一的

2.

是标准正交的。

3.

的奇异值是整数,并且从右到左是从大到小排列的

b52a488fb3b778943eb18a329701c196.png

通过例子来理解

接下去就是一个UserToMovice的例子,个人觉得非常直观,易于理解

行代表用户,列代表电影,数字代表评分

dbb453ef72c8f2c14fb71c3c0ac5b148.png

可以看到,矩阵的左上角和右下角可以呈现出2个团,左上角的可以理解成sifi电影section,右下角可以理解成是romance 。

我们对这个矩阵进行奇异值分解,就可以得到如下结果:

我们怎么理解这些呢?

b555d9503b684837f595dbf28a61220a.png

U矩阵可以理解为,用户到电影类型的矩阵,第一列和第二列我们可以分别理解为sici concept和 romance concept.(第三个特征值较小我们就先忽略不计),可以进一步理解为,前四个用户对于sici 的表现较强,后三个用户对于romance 电影的表现较强

同理可以理解sigma矩阵

28e2030bc0f9b34abf63fdd32f2d10ec.png

V可以理解为是电影到概念的相似矩阵,(前三个电影与sicix相关性较高。)

62969fa86ab65721db821d85cb96ad02.png

44a26660e23cdb866d106257d707780a.png

SVD用于降维

  1. SVD可以找到均方误差最小的坐标将数据点投射上去(MAE既视感。。。)

5bf59ff42816360ab38f3dcb63801b93.png

用刚刚用户电影评分作为例子的话

77fcae5432b898ca477a90d680d147bc.png

我们特征值中,第一个值可以理解成方差最大的坐标轴,第二个会稍稍一些

8662f339a2951a7d0404ed4aae191593.png

对于左半部分U*Sigma<我们可以理解为,这个式子给出了在转换坐标轴上的投影.

0340ad4695d8329b481c6bfe27f3cd7d.png

那么对于数据的维度降维到底是怎么做到的呢?

对于不显著的特征值,将其变为0,于是就得到了一个原矩阵的近似矩阵

84ddafd7db674e9d7322a4cd5e6f1eb4.png

cc1613c864a5e2cee3f886a397131def.png

可以用Frobenius来判断近似的好坏程度

3fc7b524272093ec416e8246b04bf7ab.png

456df95f5b0d2ba2b55f5cf377b936e6.png

ce27b40c052cad1a9f3a83f6b33d9e4c.png

结论与Case Study

最后是一个刚刚影评用户关系矩阵的例子,我们怎么使用SVD呢?

比如我们一个很喜欢Matrix,我们怎么知道和他相似的其他人呢?

6f87c66a262b1db1bf1d76aa5665b20a.png

016c9ed3974051ae5fca5dbc371bab0b.png

可以发现2个用户在原矩阵的相似度为0,但是在特征矩阵上特征相似度变高了

6206bece8992f2a06e2a25851d3da118.png

8af3ef1aa87b22b2e6f4179a316d01aa.png

df97e73f0e6c4f9adb380ae5b3fd28b5.png

最后,奇异值分解与特征分解的区别:

c63a21d2b8d823cab009bd31c7eb8581.png

最后总结了SVD的几个缺点:

  1. 可解释性较差,不是所有解释性都像电影类型这么好分类
  2. 不是稀疏的,稀疏的输入会被密集表达

fa9ffa38b7b4726998dedb52e89c3936.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值