《机器学习实战》第14章学习笔记(数据约简工具---SVD)

本文介绍了奇异值分解(SVD)的基本原理,它是一种矩阵分解技术,能将数据的主要特征提取出来。SVD在信息检索中的隐形语义索引(LSI)和推荐系统中有广泛应用。在LSI中,SVD帮助处理文档搜索的同义词问题。而在推荐系统中,SVD用于构建主题空间以计算项或人之间的相似度。
摘要由CSDN通过智能技术生成

一、SVD基本原理

提取这些信息的方法称为奇异值分解(Singular Value Decomposition, SVD )。

在很多情况下,数据中的一小段携带了数据集中的大部分信息,其他信息则要么是噪声,要么就是毫不相关的信息。在线性代数中还有很多矩阵分解技术。矩阵分解可以将原始矩阵表示成新的易于处理的形式,这种新形式是两个或多个矩阵的乘积。我们可以将这种分解过程想象成代数中的因子分解。

取前r个非零奇异值,可以还原原来的矩阵Data,即前r个非零奇异值对应的奇异向量代表了矩阵Data的主要特征,可以表示为

                                            

SVD优缺点:


二、SVD的应用

2.1 隐形语义索引

       SVD的历史巳经超过上百个年头, 但是最近几十年随着计算机的使用, 我们发现了其更多的使用价值。最早的SVD应用之一就

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值