机器学习
yz930618
Don't live the same day twice
展开
-
工业界常用推荐算法的升级之路
本文将介绍常见推荐算法的升级之路,从最初的LR到业界常用的DIN、DIEN等模型。1. 线性模型1.1 逻辑回归LR简介逻辑回归算法是一种监督学习分类算法,对特征进行线性加权求和,通过Sigmoid函数将结果映射到0-1。模型结构结构风险函数 = 经验风险项+正则项其中损失函数为经验风险项的重要组成部分损失函数:表征模型预测值与真实值的不一致程度。损失函...原创 2020-03-08 00:15:09 · 2567 阅读 · 0 评论 -
LR损失函数推导
LR的推导LR逻辑回归是一种监督学习分类算法,其实现了给定数据集到0,1的一种映射。给定数据集D={(x1,y1),(x2,y2),...,(xm,ym)},其中(xi,yi)表示第i个样本,其中,xi=(xi1,xi2,...,xin),即每个数据有n个特征,类别y={0,1},要求训练数据,将数据分成两类0或1。假定xi的n个特征为线性关系,即:...原创 2020-02-17 20:08:58 · 4895 阅读 · 0 评论 -
Xgboost与Gbdt的区别
传统GBDT以CART作为基分类器,CART以gini指数选择特征,gini指数越小,纯度越高。离散特征会依次将每个取值作为分割点计算gini系数,连续特征会依次将连续两个值的中间值作为分割点,均取gini指数最小的作为最优特征与最优切分点。Xgboost还支持线性分类器,这个时候xgboost相当于带L1和L2正则化项的LR。 传统GBDT在优化时只用到一阶导数信息,xgboost则对代价函数...原创 2020-02-17 18:09:32 · 561 阅读 · 0 评论 -
CTR预估之Deep Interest NetWork模型原理详解
本文介绍的Deep Interest NetWork是阿里妈妈盖坤带领的团队2018年8月发表在KDD的Paper,在点击率预估等场景有不错的效果。由于最近团队也准备尝试下该模型,因此提前熟悉下DIN的原理与实现。引言点击率预估在搜索、推荐、广告等领域具有很广泛及成功的应用,众多学者和公司也纷纷发表了相关Paper。随着深度学习在计算机视觉,自然语言处理等领域的重大突破,有许多研究将D...原创 2018-12-14 18:49:21 · 7715 阅读 · 0 评论 -
《基于行列式点过程的推荐多样性提升算法》原理详解
本文将详细讲解Hulu在NIPS 2018 会议上发表的《Fast Greedy MAP Inference for Determinantal Point Process to Improve Recommendation Diversity》中,提出的基于行列式点过程的推荐多样性提升算法。引言随着机器学习技术日益成熟,机器学习的应用领域也越来越广。其中,推荐领域是机器学习一个比较常...原创 2018-12-06 20:15:18 · 11756 阅读 · 17 评论 -
广告CTR预估相关模型汇总
一、FM、FFM FM:Factorization Machines FFM:Field-aware Factorization Machines for CTR Prediction二、DeepFM DeepFM:DeepFM: A Factorization-Machine based Neural Network for CTR Prediction三、Wide&...原创 2018-12-08 23:45:13 · 540 阅读 · 0 评论 -
广告点击率CTR修正-Wilson CTR
CTR(Click-Through-Rate)即点击通过率,指网络广告的点击到达率。CTR是广告推荐系统中,一项重要的衡量算法好坏的指标。计算公式: CTR = 点击数 / 曝光数由于原始CTR计算方式只考虑了相对值,没有考虑绝对值。即,没有考虑曝光的数值大小,因为,曝光少的情况下,计算出的CTR其实不可靠,样本充足的情况下,才能反应真实情况。举个例子,有三个广告:A:点击数 ...原创 2018-11-29 16:55:29 · 12721 阅读 · 1 评论 -
机器学习-集成学习方法
本次博客将详解机器学习中集成式学习方法。原创 2017-08-07 09:19:52 · 1176 阅读 · 0 评论 -
机器学习中的数学基础
本文将讲述机器学习中所涉及的数学基础。原创 2017-08-14 14:38:37 · 7870 阅读 · 0 评论 -
scikit-learn功能大全
机器学习中Scikit-learn工具包功能大全原创 2017-07-28 09:58:21 · 2891 阅读 · 0 评论 -
混合高斯模型及其求解方法
本博文主要描述了机器学习中混合高斯模型的理论及其求解方法原创 2017-07-03 17:57:53 · 2492 阅读 · 0 评论 -
机器学习-朴素贝叶斯
本文将讲解机器学习中的一种分类算法-朴素贝叶斯。原创 2017-08-08 10:25:05 · 715 阅读 · 2 评论 -
机器学习-深入理解Adaboost
本文将深入理解AdaBoost算法原创 2017-08-07 15:36:39 · 397 阅读 · 0 评论 -
机器学习-CrossValidation交叉验证
机器学习中“交叉验证法”(cross validation)以及Python代码原创 2017-07-31 10:01:54 · 2521 阅读 · 2 评论 -
基于FTRL的在线CTR预测算法
本文主要讲解基于FTRL的在线CTR预测算法的主要思想以及Java实现原创 2017-07-18 09:35:04 · 10577 阅读 · 6 评论 -
《机器学习》- 决策树
本文是对机器学习中决策树算法学习整理与归纳总结原创 2017-07-17 11:34:32 · 668 阅读 · 1 评论 -
《机器学习》- 支持向量机SVM
本文详细并深入地讲解了机器学习中SVM的实现原理以及公式推导。原创 2017-07-19 18:31:47 · 1656 阅读 · 0 评论