（2）搜索广告CTR预估

最新推荐文章于 2022-07-11 16:21:09 发布

weixin_34101229

最新推荐文章于 2022-07-11 16:21:09 发布

阅读量195

点赞数

文章标签： awk

原文链接：http://www.cnblogs.com/Lee-yl/p/10936370.html

版权

https://www.cnblogs.com/futurehau/p/6184585.html

1. CTR预估的流程

数据 -》预处理 -》特征抽取 -》模型训练 -》后处理

特征决定了达到好的评价指标的上限，模型决定了接近这个上限的程度。

2. 数据预处理

label匹配：展示日志和点击日志做一个join

采样: 负采样（广告点击率很低，随机丢弃一部分负样本

组合相关信息: 相关信息需要到别的文件中去找，所以需要组合相关信息。比如：如果需要查看某个query_id代表的是什么，需要去id号对应的txt中查询: cat queryid_tokensid.txt | awk '$1 == 14092{print $0}' | head

每次都这样操作会比较麻烦，所以需要直接把这些信息组合到训练数据中去。这就是数据预处理里面的特征组合：Join

转载于:https://www.cnblogs.com/Lee-yl/p/10936370.html

weixin_34101229

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（2）搜索广告CTR预估

https://www.cnblogs.com/futurehau/p/6184585.html1. CTR预估的流程数据 -》预处理 -》特征抽取 -》模型训练 -》后处理特征决定了达到好的评价指标的上限，模型决定了接近这个上限的程度。2. 数据预处理label匹配：展示日志和点击日志做一个join采样: 负采样（广告点击率很低，随机丢弃一部分负样本组合相关信息:...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。