推荐算法
文章平均质量分 88
程序员对白
「对白的算法屋」作者,带你少走弯路进大厂!
展开
-
旷视三年,我学到了什么
大家好,我是对白。做计算机视觉的朋友对于旷视这家公司应该都不陌生,之前我也在这家公司实习过,工作内容和技术还是比较有挑战性的。今天给大家分享一位在旷视工作三年的大佬,在职期间的一些收获与感悟,以下为原文。因为要找个房价和湿度都不太离谱的城市定居,所以离开了北京。有的人离职会偷些东西——或是宝贵敏感的数据;或是精妙的源码——我觉得这些都不是这家公司的内核、对个体而言一点都不重要,所以我带走一些故事。一. 一些“黑话”和乐观这边把研究员群体(Researcher)统称 R。家楠是 R 中的一员,样貌和着装给我的原创 2022-05-13 22:33:46 · 340 阅读 · 0 评论 -
大规模模型训练tricks集锦
大家好,我是对白。大规模模型训练其实就是在和计算、存储和通信玩的过程,所以我列一下跟这些相关的文章。一. 大规模模型并行策略先来介绍一下几种经典的并行范式,以及他们对应的经典文章1.1 数据并行(Data parallelism)不同设备执行相同模型,不同数据。▲数据并行这个比较简单,贴一篇PyTorch DDP:PyTorch Distributed: Experiences on Accelerating Data Parallel Training1.2 模型并行(Model Parallelism原创 2022-05-13 22:26:39 · 475 阅读 · 0 评论 -
命名实体识别的一点经验与技巧
最近做了一点微小的工作,搞了下命名实体识别(named entity recongnition, NER),这里总结一下目前的认识。内容比较杂,先亮一下目录,如图0-1。图0-1 目录一、什么是命名实体1.1 什么是实体实体(entity)指客观存在、并可相互区别的事物。实体可以是具体的人、事、物,也可以是概念。1.2 命名实体命名实体就是以名称为标识的实体。简单来说,如果我们听到一个名字,就能知道这个东西是哪一个具体的事物,那么这个事物就是命名实体。用大众的语言来说,只要有名字,就算阿猫阿狗也是一个命名实原创 2022-05-11 22:21:14 · 2078 阅读 · 1 评论 -
开源知识图谱整理
会持续更新NameIntroduction主页链接下载链接Alibabaopenkg阿里开源的商业知识图谱https://kg.alibaba.com/index.htmlhttps://kg.alibaba.com/index.htmlCN-DBpedia复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科http://kw.fudan.edu.cn/cndbpedia/intro/http://www.openkg.cn/dataset/cndbpediaownthink思知公司的百科图谱http原创 2022-05-10 22:36:59 · 1312 阅读 · 0 评论 -
毕业一年经历两次大裁员......
你好,我是对白。作为21届的毕业生,今年应该大都经历过互联网裁员,那我们该如何应对以后的类似情况呢?今天就给大家分享一位博主,他也是一位校招生并经历过两次裁员,让我们一起看一看他的经历,以下为原文。作者:迈唛咩 | 编辑:对白的算法屋https://www.nowcoder.com/discuss/936411我是21届的毕业生,从去年7月份开始到现在正式入职10个月,在这短短的10个月时间我经历了两次大裁员,但是幸运的是两次裁员我都是剩下的50%。这篇文章我将对自己的offer选择、职业规划做一原创 2022-05-10 22:32:57 · 353 阅读 · 0 评论 -
从985非科班到网易伏羲CV算法岗
大家好,我是对白。今天给大家分享一位985学弟春招实习艰辛上岸网易伏羲算法岗的经历,今年疫情找个实习非常难,以下为原文。一. 前言时间已经悄然走到五月份,找暑期实习的进程也到了中末阶段,在今年疫情+互联网紧缩的情势下,找个暑期实习实属不易。。😔先后经历字节排序挂😅、阿里排序挂😅、腾讯一面挂😓and各种中小厂的艰难面试,总算有收留我的企业了!希望能帮助到后面面试的同学!二. 背景1、211本,985硕,自动化转CV。2、人脸识别、步态识别方向,所涉及的知识面是识别、注意力机制、GAN方面相关。3、无原创 2022-05-09 22:40:36 · 1069 阅读 · 0 评论 -
在英特尔做了一年 AI 研发,真的很香
大家好,我是对白。很多小伙伴都对外企的工作生活很好奇,包括工作内容、加班情况和公司福利等等,今天就给大家分享一位博主在Intel的工作经历,965的生活以及公司的人文关怀都很棒,而且薪酬的竞争力也不亚于很多互联网大厂,以下为原文。作者:Theaper | 编辑:对白的算法屋https://www.nowcoder.com/discuss/941863先介绍下自己。我目前在英特尔AIA(人工智能与分析)部门任职人工智能框架工程师。2020年开始在英特尔做实习生,研究生毕业后就正式入职英特尔,至今正好一年。在这原创 2022-05-02 22:00:21 · 1564 阅读 · 2 评论 -
从双非渣硕到字节算法岗,很强
大家好,我是对白。春招已经接近尾声,今年互联网大厂都在裁员,上岸也变得更加困难。尤其是算法岗,学历背景好的人太多了,导致竞争也异常激烈。但光有学历还不够,面试主要还是看能力,今天就给大家分享一位23届双非硕士成功拿到字节算法岗offer的经历,字节的面试还是有一定难度的,以下为原文。作者:乔帮主打肖邦 | 编辑:对白的算法屋https://zhuanlan.zhihu.com/p/498252976一. 面试心路历程本人是23届校招M同学,春招累计拿到10+家公司的 算法offer(&n原创 2022-05-01 22:59:57 · 2188 阅读 · 2 评论 -
综述 | 推荐系统里预训练模型
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。来源:知乎—trouble地址:https://zhuanlan.zhihu.com/p/43361015501UPRec: User-Aware Pre-training for Recommender Systems [submitted t原创 2022-02-07 20:49:46 · 1862 阅读 · 0 评论 -
超越GraphCL,GNN+对比学习的节点分类新SOTA
拿捏了原创 2021-12-07 02:14:42 · 2992 阅读 · 0 评论 -
推荐系统技术演进趋势:召回->排序->重排
建议收藏!转载 2021-12-02 18:22:13 · 449 阅读 · 0 评论 -
召回和粗排负样本构造问题
大家好,我是对白。今天给大家分享一下在推荐中召回和粗排是如何构造负样本的。推荐系统通常分为召回->粗排->精排->重排这几个漏斗。深度模型也从精排逐步下沉到了粗排和召回。拿业界常用的粗排DSSM模型来说,模型训练样本的构造方式一般是复用精排下发的正负样本,但这会造成一个问题:粗排训练样本和实际线上打分样本分布不一致,训练样本仅是线上打分样本一个比较小的子集。面对这个问题大家通常的解法是,从精排未下发的样本里采一部分,添加至粗排模型的训练负样本中,通常会带来一定的提升。其中的原理是什原创 2021-12-02 18:18:40 · 2689 阅读 · 1 评论 -
推荐系统序列化建模总结
| 作者:没什么大不了| 学校:复旦大学| 来源知乎:https://zhuanlan.zhihu.com/p/420995638最近在做行为序列相关的工作,在这里对看过的论文做个总结。行为序列数据蕴含着用户的兴趣偏好,对该信息的挖掘可以提高推荐结果的准确性。对行为序列的建模可以归纳为两方面,特征工程和模型结构。特征是对某个行为过程的抽象表达,特征工程旨在更精确地刻画行为过程,需要对具体的业务场景有一定理解。构建完特征后,还需要运用合适的技术有效地挖掘数据中的信息,所以特征和模型两者缺一不可。学术界的一些工原创 2021-11-02 22:40:31 · 1643 阅读 · 0 评论 -
业界总结 | 如何改进双塔模型,才能更好的提升你的算法效果?
关注对白,与我一起悄悄拔尖,惊艳所有大家好,我是对白。今天写点技术干货来回馈一下我的粉丝们。本来想继续写对比学习(Contrastive Learing)相关类型的文章,以满足我出一本AI前沿技术书籍的梦想,但奈何NIPS2021接收的论文一直未公开,在arxiv上不停地刷,也只翻到了零碎的几篇。于是,我想到该写一下双塔模型了,刚进美团的第一个月我就用到了Sentence-BERT。为什么呢?因为双塔模型在NLP和搜广推中的应用实在太广泛了。不管是校招社招,面试NLP或推荐算法岗,这已经是必问的知识点了。接原创 2021-10-29 20:45:22 · 533 阅读 · 0 评论 -
业界盘点|为什么推荐算法都开始结合图神经网络了?
点击上方,选择星标或置顶,每天给你送上干货作者 | 对白出品 | 对白的算法屋编者寄语:本文看完,相信你也能熟练掌握这些基于GNN的推荐模型。大家好,我是对白。 图神经网络(GNN)相信大家也不陌生了,在还没有Graph Embedding之前,节点的属性信息可以通过Item2vec这种序列化Embedding的方式去学习,效果虽然不错,但它忽略了节点的结构信息。而GNN能够自然地整合节点属性信息和拓扑结构信息,因此在许多领域广泛应用。在推荐系统中,目前的主要挑战是从用户-物品交互以及辅助信息中学原创 2021-10-01 21:53:58 · 600 阅读 · 0 评论