自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

十三

欢迎关注微信公众号:算法工程师面试那些事儿

  • 博客(15)
  • 资源 (20)
  • 收藏
  • 关注

转载 《DKN: Deep Knowledge-Aware Network for News Recommendation》知识图谱与推荐系统结合之DKN

转自:https://cloud.tencent.com/developer/article/1095691【导读】传统的新闻推荐算法仅仅从语义层对新闻进行表示学习,而忽略了新闻本身包含的知识层面的信息。本文将知识图谱实体嵌入与神经网络相结合,将新闻的语义表示和知识表示融合形成新的embedding表示,以此来进行用户新闻推荐。这种方法考虑了不同层面上的信息,实验证明比传统的方法效果好。▌摘要网...

2019-04-29 17:10:29 10374 1

原创 推荐算法常用评价指标:NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等

1 混淆矩阵TP(true positive):表示样本的真实类别为正,最后预测得到的结果也为正;FP(false positive):表示样本的真实类别为负,最后预测得到的结果却为正;FN(false negative):表示样本的真实类别为正,最后预测得到的结果却为负;TN(true negative):表示样本的真实类别为负,最后预测得到的结果也为负.其中,TP与TN表示分类正确...

2019-04-21 20:57:27 89311 11

翻译 PySpark之机器学习库ML(分类、聚类、回归)

import findsparkfindspark.init()from pyspark.sql.session import SparkSessionspark = SparkSession.builder.appName('LIXU').getOrCreate()案例 1 使用逻辑回归预测婴幼儿存活1、加载数据数据的下载地址:http://www.tomdrabas.com/d...

2019-04-18 07:54:09 2230 1

原创 《Deep & Cross Network for Ad Click Predictions》DCN模型以及python代码

论文的下载地址:https://arxiv.org/pdf/1708.05123.pdf1 DEEP & CROSS NETWORK (DCN)1.1 Embedding and Stacking Layer在进行CTR预估时,特征经过one-hot之后,输入模型的向量会变得比较稀疏,维度非常大。因此开始有人将one-hot后的向量进行embedding,将每个特征向量转换成长度相...

2019-04-16 14:19:04 1247

转载 阿里妈妈DIN模型(Deep Interest Network)

前言  阿里的商业广告CTR预测,使用了最新的Attention机制,我们来看一下是怎么用的,在相关的推荐工作中借鉴下经验。为什么用Attention 为什么要用attention?   1) 业务中的发现,用户的历史行为数据,并不都对每一次的点击做贡献,而是仅仅有一部分在起作用。这就很像attention了,告知某些点上是与当前的状态最相关的。   举个...

2019-04-15 08:07:18 6348 1

原创 《Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction》阿里妈妈MLR模型与python代码

MLR 模型可以用于点击率CTR预估(二分类)。可以先看一下原文下载地址 https://arxiv.org/pdf/1704.05194.pdf 。数学模型写成了如下形式:文中,σ(x)σ(x)σ(x)采用Softmax函数,η(x)η(x)η(x)采用sigmoid函数,同时,g(x)=xg(x)=xg(x)=x,那么上式可以转换成:模型的损失函数为包含三部分:交叉熵损失,L2正则...

2019-04-13 19:11:14 896

转载 推荐系统的EE问题 | Bandit算法概述

转自:https://blog.csdn.net/heyc861221/article/details/80129310推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。什么是Bandit算...

2019-04-11 19:10:35 2712

原创 《Neural Factorization Machines for Sparse Predictive Analytics》NFM模型及python代码

1 原文点击【原文】即可进行下载2 NFM模型在当今互联网工业界中,有许多预测任务需要用到大量的类别特征。要想将这些类别特征送入到模型中,就必须得将其onehot。但这样一来,就会产生大量的稀疏特征,要想从这些稀疏特征中充分学习到有用的信息,必须要考虑特征之间的相互作用。FM算法是一种常用的解决方案,因为它充分考虑了二阶特征之间的相互作用。然而FM有一个缺点,就是它仅仅以线性的方式组合了特...

2019-04-10 14:30:38 1136 1

原创 《Product-based Neural Networks for User Response Prediction》PNN模型的理解与python代码

1 原文点击【原文】即可下载。2 PNNPNN(Product-based Neural Network),认为在embedding输入到MLP之后学习的交叉特征表达并不充分,提出了一种product layer的思想,既基于乘法的运算来体现体征交叉的DNN网络结构,模型如图所示PNN模型的输出:L2层输出:L1层输出:其中,lzl_zlz​,lpl_plp​以及b1b_1b...

2019-04-10 10:43:46 1222

转载 《Attentional Factorization Machines》AFM模型及python实现

1 原文没有仔细看,只是看了一下模型结构。点击【原文】即可下载。2 模型对于监督学习问题,类别特征作为输入,一般One-hot,所以需要引入特征交互来做出更精确的预测;但是如果直接以product的方式来显示交互,对于稀疏输入数据集,只能观察到一些交叉特征;所以FM被提出了,利用隐变量来做内积实现交互,但是FM也存在问题,也就是所有交互特征的权重是一样的;但是在实际中,应该预测性较低的特...

2019-04-10 08:35:31 1772

原创 《Neural Collaborative Filtering》NCF模型的理解以及python代码

1 原文2 NCF模型2.1 背景在信息爆炸的时代,推荐系统在缓解信息过载方面发挥着关键作用,已被许多在线服务广泛采用,包括电子商务,在线新闻和社交媒体网站。个性化推荐系统的关键在于根据用户过去的交互(例如评级和点击)对项目的偏好建模,称为协同过滤。在各种协同过滤技术中,矩阵分解(MF)是最受欢迎的一种,其中使用潜在特征向量来表示用户或项目,将用户和项目投射到共享潜在空间...

2019-04-09 08:38:52 13643 6

转载 转 | tensorflow和python操作中的笔记

1) 读取文件时,将固定的文件地址,采用数组或者字符串的形式,提前表示出来,后期使用时候采用拼接操作2) # 得到该目录下的文件 file_list = os.listdir(base_path + '/data/cnn_train/') file_list Out[6]: ['finance', 'it', 'sports']3) 打开一个文件 f = ...

2019-04-08 07:58:08 3674

原创 PySpark 之 ML 库之 Transformer 相关函数学习

import findsparkfindspark.init()from pyspark import SparkContextsc = SparkContext.getOrCreate()from pyspark.sql.session import SparkSessionspark = SparkSession.builder.appName('EXAMPLE').getOrC...

2019-04-07 09:36:10 2245

转载 【实践】信息流推荐算法实践 & 深入

0 文章转自:https://blog.csdn.net/dengxing1234/article/details/79756265 一. 背景负责信息流推荐系统后台算法的工作也有一段时间,从零开始构建推荐系统的过程中,在总结了业界一些成功的经验的同时,也摸索了一些有效的实践方法。愿在此沉淀,通过交流扩展眼界。推荐系统重在算法,这也是各大公司算法...

2019-04-03 11:11:38 832

原创 《Practical Lessons from Predicting Clicks on Ads at Facebook》GBDT+LR模型在CTR中的应用以及python实现

1 原文2 GBDT+LR2.1 背景CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR,LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间 ,映射后的函数值就是CTR的预估值。LR,逻辑回归模型,这种线性模...

2019-04-03 08:08:51 1118

tensorflow-DeepFM-master.zip

DeepFM作为比较新的推荐模型,某些方面优于PNN、FNN、Wide&Deep;模型。该文档包含DeepFM模型python代码。还包括一个实例。

2019-03-22

wide&deep;.zip

wide&deep;相关论文,以及以泰坦尼克号作为实例,进行应用验证。

2019-02-24

LDA主题模型.zip

LDA(Latent Dirichlet Allocation)中文翻译为:潜在狄利克雷分布。LDA主题模型是一种文档生成模型,是一种非监督机器学习技术。它认为一篇文档是有多个主题的,而每个主题又对应着不同的词。一篇文档的构造过程,首先是以一定的概率选择某个主题,然后再在这个主题下以一定的概率选出某一个词,这样就生成了这篇文档的第一个词。不断重复这个过程,就生成了整篇文章。

2019-01-05

推荐相关.zip

最近拜读了项亮博士的《推荐系统实战》,收获很大,整理了一系列的博客。欢迎查看、交流。本资源主要总结了1-6章的主要思路,并思维导图绘制。还有《集体智慧编程》、《推荐系统实战》两本书。

2018-10-28

精益数据分析1.pdf

本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。

2018-10-14

集体智慧编程.pdf

本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。

2018-10-14

推荐系统实践.pdf

《推荐系统实践》这本书对于推荐系统的各个方面介绍地很详细,如果你认为自己是推荐系统领域的专业人员,那么书中的每一个点都必须得会,最起码得知道;如果你正在全面地学习推荐系统,这本书是一个非常好的由浅入深的教材。如果你是一个学校里的科研人员,你可以在里面看到熟悉的数学模型,而且可以看到具体实施到实际生产需要解决哪些问题;如果你是一个公司里的实战人员,你可以看到熟悉的代码来理解作者表达的意思,而且也可以看到一个问题时如何用数学模型去解决的;

2018-10-10

精益数据分析.pdf

精益数据分析 如果需要其他数据分析资料(书籍、代码)请留言

2018-10-09

VS10-MFC编程.docx

比较详细的介绍了MFC的安装,使用,通过例子进行学习,分分钟学会

2018-04-13

受限玻尔兹曼机笔记.pdf

本文包括RBM的所有基础知识。代码可以见hinton的文章 玻尔兹曼机(BMS)是一种特殊的对数线性马尔可夫随机场(MRF)的形式,即,其能量函数在其自由参数的线性空间里。使他们强大到足以代表复杂的分布,我们考虑到一些变量是没有观察到(他们称为隐藏)。通过更多的隐藏变量(也称为隐藏的单位),我们可以增加的玻尔兹曼机的建模能力(BM)。受限玻尔兹曼机进一步限制BMS中那些可见-可见和隐藏-隐藏的连接。本文是一个RBM的描述。

2018-04-11

支持向量机.docx

希望哟帮助 谢谢 加油!

2018-04-02

朴素贝叶斯.docx

希望对大家有帮助。加油。 加油!

2018-04-02

k-means数据

k-means数据 机器学习 加油

2018-03-14

deeplearning学习

deeplearning学习,吴恩达 网盘地址

2018-03-14

Logistic regression.rar

针对《机器学习实战》,logistics回归python代码,知识点,疝气病症预测病马死亡率测试集训练集

2018-01-14

python入门笔记(强烈推荐).pdf

python刚刚开始学习还没入门的,可以试一下这些例题,掌握快速

2017-12-21

datingTestSet2.txt

KNN数据集,约会网站配对效果 欢迎下载

2017-12-18

隐形眼镜数据集

决策树数据集

2017-12-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除