TensorFlow Wide And Deep 模型详解与应用

Wide and deep 模型是 TensorFlow 在 2016 年 6 月左右发布的一类用于分类和回归的模型,并应用到了 Google Play 的应用推荐中 [1]。wide and deep 模型的核心思想是结合线性模型的记忆能力(memorization)和 DNN 模型的泛化能力(...

2018-03-30 14:27:13

阅读数:181

评论数:0

美团“猜你喜欢”深度学习排序模型实践

一. 引言推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 图1 美团首页“猜你喜欢”场景 目前,深度学习模型凭借其强大的表达能力和灵活的...

2018-03-30 11:14:39

阅读数:220

评论数:0

###简练目的分析####NLP WordEmbedding的概念和实现

背景 如何表示词语所包含的语义?苹果?水果?Iphone? 苹果、梨子,这两个词相关吗?语言的表示 符号主义:Bags-of-word,维度高、过于稀疏、缺乏语义、模型简单 分布式表示:Word Embedding,维度低、更为稠密、包含语义、训练复杂Word Embedding 核心思想:语义相...

2018-03-26 11:47:58

阅读数:78

评论数:0

撕起来了!谁说数据少就不能用深度学习?这锅俺不背!

作者| Andrew L. Beam编译| AI100撕逼大战,从某种角度,标志着一个产业的火热。最近,大火的深度学习,也开始撕起来了。前几日,有一篇帖子在“Simply Stats”很火,作者Jeff Leek在博文中犀利地将深度学习拉下神坛,他谈到了深度学习现在如何狂热,人们正试图用这个技术解...

2018-03-22 09:14:23

阅读数:205

评论数:0

BigchainDB白皮书,中文翻译

BigChainDB:可扩展区块链数据库这篇白皮书介绍BigChainDB。BigChainDB填补了去中心生态系统中的一个空白:是一个可用的去中心数据库。它具有每秒百万次写操作,存储PB级别的数据和亚秒级响应时间的性能。BigChainDB的设计起始于分布式数据库,通过创新加入了很多区块链的特性...

2018-03-21 10:05:26

阅读数:896

评论数:0

为什么要做用户行为分析?

一、什么是用户行为?用户行为由最简单的五个元素构成:时间、地点、人物、交互、交互的内容。(一)什么是用户行为?对用户行为进行分析,要将其定义为各种事件。比如用户搜索是一个事件,在什么时间、什么平台上、哪一个ID、做了搜索、搜索的内容是什么。这是一个完整的事件,也是对用户行为的一个定义;我们可以在网...

2018-03-19 16:33:09

阅读数:331

评论数:0

不均衡数据怎么破?对付它的七种武器!

先问大家一个问题:银行欺诈识别、市场实时交易、网络入侵检测等领域的数据集,有哪些共通点?答案是:“关键”事件在数据中的占比经常少于1%(例如:信用卡行骗者、点击广告的用户或被攻破的服务器的网络扫描)。然而,大多数机器学习算法在不均衡数据集的表现都不太好。以下七种技术可以帮到你,训练一个分类器用于检...

2018-03-12 09:58:41

阅读数:113

评论数:0

笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)

本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营——————————————————————————————————————————一、风控建模流程以及分类模型建设1、建模流程该图源自课程讲义。主要将建模过程分为了五类...

2018-03-08 20:20:08

阅读数:352

评论数:0

ks值和auc值的关系

        要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的。其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已。拿逻辑回归举例,模型训练完成之后每个样本都会得到一个类概率值(注意是类似的类),把样本按这个类概率值排序后分成10等份,每一份单...

2018-03-01 15:14:43

阅读数:3157

评论数:1

提示
确定要删除当前文章?
取消 删除
关闭
关闭