隐语义模型的深入理解
- 有一个用户和商品的样本矩阵
- 通过求解权值来求出目标矩阵
梯度下降法的问题
当样本很大的时候,计算会非常繁琐
可以用:随机梯度下降法 SGD
从数据集中随机抽取一个样本,求出惩罚项
注:随机梯度下降法可以和梯度下降法得到相同结果
奇异值矩阵分解
图解:
只取一小块是为了抽取出隐分类,类似于“找近义词”
问题:
- 矩阵的存储问题,矩阵很稠密
- 计算量太大,只能用在小型的系统
所以才有后面的随机梯度下降法
注:svd算法还有许多改进版本
“隐语义”的真正背景
https://blog.csdn.net/puqutogether/article/details/41696295