推荐分享

推荐分享

流量变现-广告

推荐核心:
匹配 相似性 : 人和人、物品和物品、用户特征和商品特征
排序

算法

  • 协同过滤:数据要的少,效果可以 使用普遍
  • 广义线性模型: 特征拟合,找用户特征
  • 深度学习: 数据中自动找特征
  • 强化学习: 人工干预很少,封闭系统。类似人主动学习。

趋势:

  • 搜索和推荐融合
  • AI和传统算法
  • 隐私政策强时,数据少,就用小样本和端(实时记录)、云(历史记录)协统技术

协同过滤

矩阵分解
聚类

问题

  • 稀疏,品类太多,用户购买同一个几率小

  • 相似度度量:微信和陌陌对相似度权限贡献相同

  • 可扩展性:计算量随着user item增加而增加O(m*n)

  • 聚类

  • 矩阵分解
    user-item 交互信息中 矩阵分解来挖掘

冷启动、数据热点(流行)

广义线性

p(click|show) = w.x

比如逻辑回归,其实不是绝对线性,但是线性思维,所以叫广义线性

高维稀疏特征-

  • ID型、离散型特征可用one-hot独热编码
  • 特征组合,丰富特征
  • 如果人工找的特征效果不好,就可以用机器方法找特征(GBDT)、特征组合学习-因子分解机(FM)、实时机器学习(流计算)

在线学习

FTRL(Google,2013)
特征学到了就直接丢掉了,不需要迭代学习
不会出现数据量一直增大导致学习计算量持续增长情况
实时推荐系统

基于树的特征挖掘
gbdt

深度学习

设计多个神经元,每个神经元都判断某个特征
比如多个神经元分别判断猫 眼睛 头 尾巴 体长等 ,如果达到某个数值的神经元超出了判断阈值,就认定这个物体是猫

问题:

  • 高维稀疏特征不适用,因为有全连接,导致连接数太多

广度&深度学习模型

宽特征用LR
窄特征用DL

强化学习

样本少时可以用

建立 推荐引擎到环境(用户)的闭环

人特别容易变化,所以强化学习是未来趋势

目前效果还不太好,收敛速度慢,生产环境使用很少

推荐指标

  • 用户满意度 点击率 转化率
  • 多样性 推荐之间差异化 不相似
  • 准确性
  • 新颖性
  • 鲁棒性 反作弊 稳健性
  • 覆盖率 长尾物品和用户
  • 惊奇性
  • 实时性
  • 用户信任度-推荐理由?

除了固定的一些数据指标,还可以加上一些用户问卷,比如给用户交互点击是否喜欢推荐的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值