1. 对推荐的大体感悟

最新推荐文章于 2022-10-21 20:56:14 发布

置顶 qq_31319099

最新推荐文章于 2022-10-21 20:56:14 发布

阅读量221

点赞数

分类专栏：打酱油文章标签： hadoop 机器学习 python

本文链接：https://blog.csdn.net/qq_31319099/article/details/112725821

版权

打酱油专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

笔者是名半吊子算法工程师，毕业专业是物理类学科，标准半路出家。所以，基础薄弱，技术能力颇为捉急。到现在，从事推荐算法岗位也算有一段时日，勉强积攒了一些关于这一领域的浅显知识，不少还是谬误。因此，有空就来分享一下，共同交流，共同进步。错误之处，恳请大家不吝指出，感谢。

搞推荐的平时要干啥

推荐的工作目的很明确，是为了提升上头确定的商业指标。但是，具体的工作就五花八门了。“算法工程师”这个职位，其实是“算法”和“工程”的混合体，前者是学术里的概念，但后者却是具体的工作。在国内公司里的“算法工程师”们，通常绝大部分时间都是在搞工程，而算法的占据部分，实在是微不足道。言归正传，他们主要的工作有：
1.整合落地数据。主要是清洗和关联，理出训练数据和测试数据，以及需要线上缓存的数据，定时写缓存。这部分工作的初始化比较麻烦，但主要就是体力活，框架搭建好之后，主要就是时不时检查一下问题，修修补补。
2.对线上、线下数据进行监控，时不时肉眼观察观察，尽量避免大坑。尽管很多时候，兄弟团队可能拍着胸脯和你保证数据绝对没问题，但我必须要说，这个是不可能的，绝对绝对绝对不要完全信任他人的工作！特别是和你不是同一个KPI的团队。懒惰是人的天性，这个需要切记。这边见过太多的惨痛案例，后端数据的重复、字段缺失、任务失败未重试，前段界面的“隐形”展示、版本更新不及时等等，常常屡见不鲜。
3.应对各方的质问，提供样例的实证。由于推荐的效果大部分是来自于推荐模型，所以当展示效果有“问题”时（为啥这个商品质量不咋的还放出来之类的），各方部门的产品经理、或者领导就常常会直接过来进行挑战（@你一下是常见操作）。考虑到这部分人群的优先级别，常常需要花半天时间，定位到这个问题，然后给出合理的解释，比如说这个商品历史点击率高，出价高，或者你经常看这类商品，等等。并且，挑战的时间经常是在下班前，从而，下班的时间就…呵呵了
4.和其他团队多沟通。基于对其他团队工作的依赖，没事多聊聊是非常有必要的，万一有求于人，或者是对方改了什么的，又忘记告诉你，那就尴尬了…
5.模型训练。这部分工作相对而言是比较简单直接，无需考虑太多的外界因素，主要就是基于监督标签确定具体的训练算法，超参，训练中的trick等等。它比较耗你的技术存储和脑力，但确实是你最具价值的部分。之所以把这部分工作放在后面再说，是因为，前面的工作才是主要的部分。值得一提的是，“好”的模型是需要综合考虑“效果”和“可解释性”的。由于3）中提到的各方的挑战，你需要基于模型给出合理的解释，好堵住他们的嘴。如果是复杂度很高的模型，很有可能会出现你也无法解释为啥会是这个结果。线上生产环境的应用模型，只有为数不多的公司敢于上完全版深度学习，个人觉得可能也是这方面的考虑。LR + GBDT的经典之处，个人觉得正在于是两者的综合。
6.线上实验。有一说一，线上的效果才是真正可以用来吹的干货，线下的工作干得再多再好，不顶用。
7.多汇报工作，加上适当的夸张。这个耗时不多，但确实是最重要的部分。领导们日理万机，谁还记得你具体干了啥，干到哪了？有点成果就汇报汇报，有空就整个漂亮的报告，图表一看，领导心里有点数了，给你的绩效评估也会写点赞扬的话。

后续部分

后续，会介绍一下互联网平台下，笔者比较了解的几类推荐，包括计算广告、电子小说、酒店查询等，以及相关的后台实现细节。
PS: 相关图片为网上搜集，若有侵权，通知删除。

qq_31319099

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1. 对推荐的大体感悟

首篇博客，测试一下##前言笔者是名半吊子算法工程师，毕业专业是物理类学科，标准半路出家。所以，基础薄弱，技术能力颇为捉急。到现在，从事推荐算法岗位也有一段时日，勉强积攒了一些关于这一领域的浅显知识，不少还是谬误。因此，有空就来分享分享，共同交流，共同进步。错误之处，恳请大家不吝指出，感谢。##推荐是啥推荐，可以简单近似认为，从可用资源中，选取合适的资源，提供给目标客户。从而，吸（hu）引（you）进行下单/点击/浏览…这一类的正向反应。例如，假设你是个大帅比（漂亮），当你走进商场逛逛时，门店的工作
复制链接

扫一扫