c++svd算法_数据挖掘——推荐算法（数据挖掘的最广泛应用）

佐伊23

于 2020-12-29 05:18:46 发布

阅读量362

点赞数

文章标签： c++svd算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29098367/article/details/112123241

版权

在这个信息过载的时代，推荐应该做精准营销——target marketing。如果先做一个用户画像（profile），则会更精准的推荐用户需要的。

Targeted Advertisement：

比如，可以根据浏览的新闻预测兴趣点进行推荐

手机上，用不同网页浏览新闻会有不同的广告推荐。因为当手机浏览该网页的时候，网页的后台是可以获取你的手机型号，地理位置，可以会有更适合用户的广告投放策略。

网站会预先推荐一系列的音乐。根据用户听音乐的时间，对音乐的一系列操作都会使系统推荐更适合用户的音乐

TF-IDF

输入一个关键词，它和计算机存储的大量文本之间关联程度的量化标准。

word loud

单词在特定文档中出现的频率：TF（Term Frequency）

一般性的定义

英文中的冠词，例如：the，频率很高，但是没有什么意义，会在搜索的时候过滤掉

单词在其他文档中出现的频率：IDF（Inverse Document Frequency）

例如：the，每个文档都出现，值为0

TF-IDF：

Multiple query words：

Trem-Document Matrix：

文本处理的时候常常建立这种矩阵

每一列代表文章，行代表单词

Vector Space Model

计算机是不会处理文字的，所有的文本都需要转换为数值的形式

给定一个文本（规定1w个关键词），那么一篇文档就会变为一个1w维的向量，向量每一位说明这个单词是否出现（0,1）或者出现次数或TF-IDF。

由于已经转换成了两个向量，那么我们可以通过计算两个向量的余弦值（夹角大小）来量化两个向量的相似程度，用该方法也可以进行文档聚类。如果两个向量的夹角越

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
c++svd算法_数据挖掘——推荐算法（数据挖掘的最广泛应用）

在这个信息过载的时代，推荐应该做精准营销——target marketing。如果先做一个用户画像（profile），则会更精准的推荐用户需要的。Targeted Advertisement：比如，可以根据浏览的新闻预测兴趣点进行推荐手机上，用不同网页浏览新闻会有不同的广告推荐。因为当手机浏览该网页的时候，网页的后台是可以获取你的手机型号，地理位置，可以会有更适合用户的广告投放策略。网站会预先推荐...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。