机器学习-4

实践
问题建模
建模是实现业务的部分
不同的业务目标导致不同的模型
分类
内容是否有价值
回归
内容明天的浏览量
排序
给搜索词确定内容的展现列表
推荐
给用户历史浏览确定内容的展现列表
我们想要什么
模型预测的Y是什么
往往会想很多X特征
我们想干什么
两种检索系统
网页的检索系统
离线建库
在线检索:解析-触发-排序
排序任务
网页质量和关键词相关性模糊
候选集庞大,数据相对长尾
百度指数
大量使用人工标记的数据
广告的检索系统
广告主提交审核建库
在线检索:解析-触发-排序
特征+模型
特征:X与Y的关系
非线性关系
把信息放在模型中
不能够确定精确的特征选取,特征比较原始
把信息放在特征中
能够确定特征选取
非独立的关系
复杂的模型表示-决策树,特征比较原始
组合特征来事先确定特征选取
模型
假设
参数
特征获取
lowlevel
对业务场景直接表述的特征
highlevel
图像的SIFT特征,图像的CNN特征
专家对用户行为解读后的预测的特征
人工方法
领域专家知识、对事情的深入理解
非线性复杂深层次的关系
因果的理解,强的泛化性
样本数据不那么依赖
自动方法
自动化方法、嵌入式
四个场景
网页
query和doc之间重合文本的比例
区分query中term的重要性,doc中title的重要性
基于搜索数据的统计特性(独立搜索term词)
泛化,字面不同的term未必不相关
位置关系、间隔和顺序
用户个性化特征,query表达之外的特征
商业
关注query本身的特征,用于预估ctr
垂直
人工标注
领域知识整理和运营
知识挖掘、知识应用
根据领域特性定制
不能推广到一般化的方法
最长query匹配。。。
图像
图文两者空间不同,没有直接构造相关性特征
图文的pair对
文本表示 和 图像表示 之间进行语义相关性特征
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值