协同过滤

协同过滤

重要性:比如买化妆品,人们肯定不会把所有的化妆品全部试一遍,会看和自己类似的人使用过那些产品,会根据自己历史经验看一下相类似的产品,这两类就可以分别的称之为User CF和Item CF。该为协同过滤的核心。

算法分类:

朴素:swing机制推荐、基于点击行为的用户和物品推荐;

隐喻:将高维离散的物品或者用户向量jian降维成低维度的向量标识。

Account2Vector机制:用户点击行为模型成一个句子串,Account为每一个词,模型生成Account的词向量,cosine计算相似度pair。

模型(单侧的向量化):word2vector、fasttext

CBOW : 四周词(向量相加)去预测标词 ;  SKIPGRAM:目标词->四周词;负采样:目标词->该样本下非四周词。

提速方式:霍夫曼树、负采样

霍夫曼树:

Ngram : unigram\bigram\trigram

隐因子模型( 端到端):矩阵分解(MF):基于矩阵分解的思想,根据用户和广告的已知点击关系,生成用户、广告的低维向量。目标函数是:真实值和预估值之间的差值最小。

添加bias :用户偏置项和item偏置项。

参考文献:https://www.cnblogs.com/zhangchaoyang/articles/5517186.html

主要分类为:

DSSM:Deep Match, 将用户向量和广告向量分布通过DNN 网络embeding向量化。embeding时的词向量维度为8;最后一层为16(255->128->16); 3层DNN,,点击行为作为训练目标,sigmod作为激活函数。

 

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值