聊聊我在美团做算法的感受

最新推荐文章于 2024-06-26 07:00:00 发布

zenRRan

最新推荐文章于 2024-06-26 07:00:00 发布

阅读量319

点赞数

文章标签：算法人工智能机器学习深度学习神经网络

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247506328&idx=2&sn=82f4030ad3f7cc358297bbcd427bd4f5&chksm=eb53cd0bdc24441d90ba4a62997711523b8a2149e6ec34d23acbb3876b316b6d0aa7ec605e9a&scene=126&&sessionid=0

版权

点击上方，选择星标或置顶，每天给你送上干货

卷友们好，我是对白。

虽然假期余额已然不足，但我们依然不能停下奋斗的脚步，因为总有人比你更努力，也比你更卷，在算法的这条道路上卷出了天际。

哈哈开个玩笑，今天我们不讲前沿的算法论文，而是想和大家简单聊聊我在美团做算法的感受，后期也会专门写一篇文章《我在美团做算法的这大半年经历了什么》，讲讲美团目前在使用哪些前沿的算法，在业务中算法经常会遇到哪些典型的问题，希望能与同行们多多交流。

目前我在美团做算法已经大半年了，前后主R了多个业务（基本三个月一个业务），包含NLP、推荐以及动态定价。.在这个过程中深深地感觉到有标注的数据对于一名算法工程师来说是多么的重要，但大多数业务的数据往往是没有标签的，自己标注也不现实，因为你没有充分的业务知识；而就算数据有标签，也只是一小部分，甚至还会出现PM和运营同学疏忽导致标错的可能性QAQ（这个只有你在分析badcase时才会发现...），因此在绝对的OKR面前，你只有想尽办法达到与有监督学习一样的效果，否则你只有卷铺盖走人了。这时对比学习出现了，它是自监督学习的一种，也是目前学术界和工业界绝对的热点，在ICLR2020上深度学习三巨头 Bengio 、 LeCun和Hinton就一致认定自监督学习（Self-Supervised Learning）是AI的未来。因此这也成为了我以后做算法主攻的方向之一。

对比学习的出现，真正的给CVer、NLPer和Recommender都带来了极大的福音，具体来说：

1、在CV领域，解决了“在没有更大标注数据集的情况下，如何采用自监督预训练模式，来从中吸取图像本身的先验知识分布，得到一个预训练模型”的问题；

2、在NLP领域，验证了”自监督预训练使用的数据量越大，模型越复杂，那么模型能够吸收的知识越多，对下游任务效果来说越好“这样一个客观事实；

3、在推荐领域，解决了以下四个原因：数据的稀疏性、Item的长尾分布、跨域推荐中多个不同的view聚合问题以及增加模型的鲁棒性或对抗噪音。

借助着对比学习这项技术，我也顺利的完成了自己的OKR（明天晋升应该稳了），对这项技术也有了更深入的掌握，也在这个过程中，我开设了自己的个人公众号，前后写了九篇有关于对比学习的文章：