自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 大语言模型人类偏好对齐技术:基本原理和前沿研究(2024)

本文对微调对齐相关研究工作进行深入调研,并结合自身近一年的微调对齐工作经验(部分),梳理和总结知识框架。

2024-05-08 16:50:54 2259 1

原创 推荐系统之排序:基本原理和前沿研究(2023)

本文对工业界和学术界相关进展进行深入调研,并结合自身过往工作经验,对推荐系统中排序过程涉及知识进行总结。

2023-09-25 07:45:36 2003 1

原创 推荐系统之召回:基本原理和前沿研究(2023)

针对学术界和工业界的调研、结合自身工作经验,总结常用的召回策略和前沿研究方向。具体内容报告请见:从海量的候选集合中发现用户当前感兴趣或相关的物品集合(几百到几千),过滤掉绝大多数不喜欢的物品。考虑召回通道的多样性和高覆盖率,对时延有一定要求,低准确率要求(折中)。趋势:目前双塔模型占主流,近几年召回学习模型越来越复杂(复杂程度逼近排序模型),有召回+排序融合或联合训练趋势。

2023-09-24 20:40:20 1902 1

原创 搜广推之特征工程:基本原理和前沿研究(2023)

本文主要结合以往工作经验和前沿论文,来分析工业界和学术界中特征工程相关研究点,以及对未来发展的思考。

2023-09-24 17:40:24 903 1

原创 SLIM推荐模型及分析

SLIM推荐模型及分析 SLIM[1]是Sparse Linear Model简称,即稀疏线性模型,该方法是基于物品相似度的推广形式,而且效果很好,如下面公式 minimize ||A−AW||22+β2||W||22+λ||W||1(1) minimize \ ||A-AW||_2^2+\dfrac{β}{2} ||W||_2^2+λ||W||_1(1) subject to Wi,j

2016-12-20 17:37:01 8981 2

原创 Cluster: ROCK & CLOPE

在实际问题中我们经常会碰都一些类别类型的数据,比如电子商务中交易型数据,在这些数据上进行聚类我们无法采用基于距离的空间几何做法,有人便说可以采用相似度来做,比如jaccard系数、互信息等,确实可以如此,这里针对类别型数据讨论两种聚类算法。

2015-10-14 19:44:04 891

原创 Cluster: FarthestFirst

顾名思义,每一次取最远的那个点,那么farthest在cluster如何使用的呢? 我们知道在层次聚类特别是凝聚类中每次合并的是最近两个cluster,假设这里的cost是指当前所有聚类中最大的那个半径,那么如何设计一个近似算法并证明其cost与最优k-cluster的cost比值满足一定界限。

2015-10-14 10:56:19 3136

原创 Cluster: EM

EM聚类算法(survey)最近项目需要对Cluster进行一个survey,需要利用cluster进行feature selection,觉得EM聚类也算是一个比较经典算法。

2015-10-12 18:57:32 924

原创 语言模型Katz backoff以及HMM模型

之前关于信息抽取那篇文章提到使用HMM对文章段落进行分段并标注,其中会使用到trigram-HMM并对传统的HMM进行改造以符合特定情况下使用。这里分别对Katz backoff以及HMM模型在具体状况下的使用。

2015-08-26 20:31:42 4771

原创 win8 64bit下srilm+cygwin实现ngram语言模型

ngram语言模型平滑+win8 64bit下安装srilm、cygwin

2015-08-22 21:12:41 2090 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除