搜索推荐与计算广告
文章平均质量分 94
搜索与推荐Wiki
这个作者很懒,什么都没留下…
展开
-
ABTest流量分发和业界的一些经验
流量为王的时代,如何精准的利用用户的流量进行分析和产品的迭代?ABTest就是其中不可缺少的一环,那么ABTest是什么呢?下面来一层一层揭开它神秘的面纱。0.流量分发在互联网流量的分发模式中,主要的两种分发模式为:中心化:平台负责流量的分配,节点的流量来自平台分配,平台拥有流量的控制权,比如像淘宝、京东、美团等互联网产品都是一个中心化的流量分发模式去中心化:相对于中心化而言,去中心化模式并不负责流量的分配,节点的流量需要自己获取,节点本身拥有流量的控制权,其中典型的产品是微信,张小龙在阐述微信公原创 2021-04-13 17:10:13 · 2113 阅读 · 1 评论 -
关于推荐算法工程师大家比较关注的几个问题
今天在《推荐系统开发实战》的读者群里聊天,在探讨技术问题的时候发现也有朋友对一些非技术的问题比较感兴趣,这里进行总结和分享,希望能够帮助到看这篇文章的人。欢迎加我的微信进行技术交流,非技术的人生思考问题也可以进行探讨。我的微信号如下图以下问题,随机排序,不分先后!Q、推荐算法工程师的工资待遇怎么样A:这个问题真的是很直接呀,当然可以理解,毕竟我们工作就是为了赚钱,为了生活。推荐算法工程师和算法工程师的待遇基本差不多,不过不同地方、不同级别的推荐算法工程师待遇肯定是不一样,比如一线的北上广深原创 2020-07-24 12:00:41 · 45661 阅读 · 1 评论 -
独孤九剑:算法模型训练的一般流程
这篇文章主要分享一下模型训练的一般流程,目的是让大家明白做一个算法模型过程中会涉及的流程和数据特征在算法模型中的重要性。作为一名算法工程师训练模型可谓是家常便饭,不管是做推荐中的召回模型、排序模型还是其他领域的分类模型等,都应该有一个规范化的流程,这样在做模型的过程中也会更加清晰,当然也不一定完全遵循这个流程,只是说基本过程应该是一致的。1、总诀式——定义问题What,How,Why。首先要弄清楚自己要干什么,然后调研相关的技术确定怎么解决问题,最后反思自己为什么要用这个方案解决这个问题,有没有更好的原创 2020-06-29 07:27:36 · 3152 阅读 · 0 评论 -
CTR预估模型中的正负样本定义、选择和比例控制
目前推荐系统中给用户进行推荐大部分都是基于CTR预估来做的,CTR预估中很重要的一环便是正负样本的选择,那么不同业务场景下我们如何定义正负样本、如何控制正负样本的比例、正负样本选择有哪些技巧?虽然这些只是模型训练中的一环,但却也扮演着重要的角色。这篇文章简单聊一下上边提到的问题,如何你对这有什么想法和意见,欢迎在评论区留言,一起沟通。分析业务场景不同业务场景下对应的kpi也是不同的,那么模型训练的目标也是不一致的,比如kpi是点击率,那么模型训练的目的就是增加推荐的准确性,提升用户的准确率;如果k.原创 2020-06-19 10:02:54 · 4372 阅读 · 4 评论 -
LTR|怎么理解基于机器学习“四大支柱”划分的学习排序方法
Learning to rank(LTR,L2R)也叫排序学习,泛指机器学习中任何用户排序的技术,是指一类监督学习(Supervised Learning)排序算法。 LTR被应用在很多领域,比如信息检索(Information Retrieval)、推荐系统(Recommend System)、搜索引擎(Search Engine)。LTR框架一般来讲,根据机器学习的“四大支柱”,LTR分为...原创 2020-03-21 14:02:44 · 5028 阅读 · 3 评论 -
搜索引擎:MapReduce实战----倒排索引
1.倒排索引简介倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。有两种不同的反向索引形式:一条记录的水平反向索引(或者反向档案索引)包含每个引用单词的文档的列表。 一个单词的水平反向索引(或者完全反向索引)又包含每个单词在一个文...原创 2015-07-28 10:23:59 · 4782 阅读 · 1 评论