- 博客(15)
- 资源 (20)
- 收藏
- 关注
转载 《DKN: Deep Knowledge-Aware Network for News Recommendation》知识图谱与推荐系统结合之DKN
转自:https://cloud.tencent.com/developer/article/1095691【导读】传统的新闻推荐算法仅仅从语义层对新闻进行表示学习,而忽略了新闻本身包含的知识层面的信息。本文将知识图谱实体嵌入与神经网络相结合,将新闻的语义表示和知识表示融合形成新的embedding表示,以此来进行用户新闻推荐。这种方法考虑了不同层面上的信息,实验证明比传统的方法效果好。▌摘要网...
2019-04-29 17:10:29 10374 1
原创 推荐算法常用评价指标:NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等
1 混淆矩阵TP(true positive):表示样本的真实类别为正,最后预测得到的结果也为正;FP(false positive):表示样本的真实类别为负,最后预测得到的结果却为正;FN(false negative):表示样本的真实类别为正,最后预测得到的结果却为负;TN(true negative):表示样本的真实类别为负,最后预测得到的结果也为负.其中,TP与TN表示分类正确...
2019-04-21 20:57:27 89311 11
翻译 PySpark之机器学习库ML(分类、聚类、回归)
import findsparkfindspark.init()from pyspark.sql.session import SparkSessionspark = SparkSession.builder.appName('LIXU').getOrCreate()案例 1 使用逻辑回归预测婴幼儿存活1、加载数据数据的下载地址:http://www.tomdrabas.com/d...
2019-04-18 07:54:09 2230 1
原创 《Deep & Cross Network for Ad Click Predictions》DCN模型以及python代码
论文的下载地址:https://arxiv.org/pdf/1708.05123.pdf1 DEEP & CROSS NETWORK (DCN)1.1 Embedding and Stacking Layer在进行CTR预估时,特征经过one-hot之后,输入模型的向量会变得比较稀疏,维度非常大。因此开始有人将one-hot后的向量进行embedding,将每个特征向量转换成长度相...
2019-04-16 14:19:04 1247
转载 阿里妈妈DIN模型(Deep Interest Network)
前言 阿里的商业广告CTR预测,使用了最新的Attention机制,我们来看一下是怎么用的,在相关的推荐工作中借鉴下经验。为什么用Attention 为什么要用attention? 1) 业务中的发现,用户的历史行为数据,并不都对每一次的点击做贡献,而是仅仅有一部分在起作用。这就很像attention了,告知某些点上是与当前的状态最相关的。 举个...
2019-04-15 08:07:18 6348 1
原创 《Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction》阿里妈妈MLR模型与python代码
MLR 模型可以用于点击率CTR预估(二分类)。可以先看一下原文下载地址 https://arxiv.org/pdf/1704.05194.pdf 。数学模型写成了如下形式:文中,σ(x)σ(x)σ(x)采用Softmax函数,η(x)η(x)η(x)采用sigmoid函数,同时,g(x)=xg(x)=xg(x)=x,那么上式可以转换成:模型的损失函数为包含三部分:交叉熵损失,L2正则...
2019-04-13 19:11:14 896
转载 推荐系统的EE问题 | Bandit算法概述
转自:https://blog.csdn.net/heyc861221/article/details/80129310推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。什么是Bandit算...
2019-04-11 19:10:35 2712
原创 《Neural Factorization Machines for Sparse Predictive Analytics》NFM模型及python代码
1 原文点击【原文】即可进行下载2 NFM模型在当今互联网工业界中,有许多预测任务需要用到大量的类别特征。要想将这些类别特征送入到模型中,就必须得将其onehot。但这样一来,就会产生大量的稀疏特征,要想从这些稀疏特征中充分学习到有用的信息,必须要考虑特征之间的相互作用。FM算法是一种常用的解决方案,因为它充分考虑了二阶特征之间的相互作用。然而FM有一个缺点,就是它仅仅以线性的方式组合了特...
2019-04-10 14:30:38 1136 1
原创 《Product-based Neural Networks for User Response Prediction》PNN模型的理解与python代码
1 原文点击【原文】即可下载。2 PNNPNN(Product-based Neural Network),认为在embedding输入到MLP之后学习的交叉特征表达并不充分,提出了一种product layer的思想,既基于乘法的运算来体现体征交叉的DNN网络结构,模型如图所示PNN模型的输出:L2层输出:L1层输出:其中,lzl_zlz,lpl_plp以及b1b_1b...
2019-04-10 10:43:46 1222
转载 《Attentional Factorization Machines》AFM模型及python实现
1 原文没有仔细看,只是看了一下模型结构。点击【原文】即可下载。2 模型对于监督学习问题,类别特征作为输入,一般One-hot,所以需要引入特征交互来做出更精确的预测;但是如果直接以product的方式来显示交互,对于稀疏输入数据集,只能观察到一些交叉特征;所以FM被提出了,利用隐变量来做内积实现交互,但是FM也存在问题,也就是所有交互特征的权重是一样的;但是在实际中,应该预测性较低的特...
2019-04-10 08:35:31 1772
原创 《Neural Collaborative Filtering》NCF模型的理解以及python代码
1 原文2 NCF模型2.1 背景在信息爆炸的时代,推荐系统在缓解信息过载方面发挥着关键作用,已被许多在线服务广泛采用,包括电子商务,在线新闻和社交媒体网站。个性化推荐系统的关键在于根据用户过去的交互(例如评级和点击)对项目的偏好建模,称为协同过滤。在各种协同过滤技术中,矩阵分解(MF)是最受欢迎的一种,其中使用潜在特征向量来表示用户或项目,将用户和项目投射到共享潜在空间...
2019-04-09 08:38:52 13643 6
转载 转 | tensorflow和python操作中的笔记
1) 读取文件时,将固定的文件地址,采用数组或者字符串的形式,提前表示出来,后期使用时候采用拼接操作2) # 得到该目录下的文件 file_list = os.listdir(base_path + '/data/cnn_train/') file_list Out[6]: ['finance', 'it', 'sports']3) 打开一个文件 f = ...
2019-04-08 07:58:08 3674
原创 PySpark 之 ML 库之 Transformer 相关函数学习
import findsparkfindspark.init()from pyspark import SparkContextsc = SparkContext.getOrCreate()from pyspark.sql.session import SparkSessionspark = SparkSession.builder.appName('EXAMPLE').getOrC...
2019-04-07 09:36:10 2245
转载 【实践】信息流推荐算法实践 & 深入
0 文章转自:https://blog.csdn.net/dengxing1234/article/details/79756265 一. 背景负责信息流推荐系统后台算法的工作也有一段时间,从零开始构建推荐系统的过程中,在总结了业界一些成功的经验的同时,也摸索了一些有效的实践方法。愿在此沉淀,通过交流扩展眼界。推荐系统重在算法,这也是各大公司算法...
2019-04-03 11:11:38 832
原创 《Practical Lessons from Predicting Clicks on Ads at Facebook》GBDT+LR模型在CTR中的应用以及python实现
1 原文2 GBDT+LR2.1 背景CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR,LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间 ,映射后的函数值就是CTR的预估值。LR,逻辑回归模型,这种线性模...
2019-04-03 08:08:51 1118
tensorflow-DeepFM-master.zip
2019-03-22
LDA主题模型.zip
2019-01-05
推荐相关.zip
2018-10-28
精益数据分析1.pdf
2018-10-14
集体智慧编程.pdf
2018-10-14
推荐系统实践.pdf
2018-10-10
受限玻尔兹曼机笔记.pdf
2018-04-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人