- 博客(9)
- 资源 (9)
- 收藏
- 关注
转载 TensorFlow Wide And Deep 模型详解与应用
Wide and deep 模型是 TensorFlow 在 2016 年 6 月左右发布的一类用于分类和回归的模型,并应用到了 Google Play 的应用推荐中 [1]。wide and deep 模型的核心思想是结合线性模型的记忆能力(memorization)和 DNN 模型的泛化能力(generalization),在训练过程中同时优化 2 个模型的参数,从而达到整体模型的预测能力最优...
2018-03-30 14:27:13 631
转载 美团“猜你喜欢”深度学习排序模型实践
一. 引言推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 图1 美团首页“猜你喜欢”场景 目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学...
2018-03-30 11:14:39 967
转载 ###简练目的分析####NLP WordEmbedding的概念和实现
背景 如何表示词语所包含的语义?苹果?水果?Iphone? 苹果、梨子,这两个词相关吗?语言的表示 符号主义:Bags-of-word,维度高、过于稀疏、缺乏语义、模型简单 分布式表示:Word Embedding,维度低、更为稠密、包含语义、训练复杂Word Embedding 核心思想:语义相关的词语,具有相似的上下文环境,例如, 苹果和梨子 所做的事情:将每个词语训练成,词向量实践 基于ge...
2018-03-26 11:47:58 283
转载 撕起来了!谁说数据少就不能用深度学习?这锅俺不背!
作者| Andrew L. Beam编译| AI100撕逼大战,从某种角度,标志着一个产业的火热。最近,大火的深度学习,也开始撕起来了。前几日,有一篇帖子在“Simply Stats”很火,作者Jeff Leek在博文中犀利地将深度学习拉下神坛,他谈到了深度学习现在如何狂热,人们正试图用这个技术解决每一个问题。但是呢,只有极少数情况下,你才能拿到足够的数据,这样看来,深度学习也就没那么大用处了。帖...
2018-03-22 09:14:23 527
转载 BigchainDB白皮书,中文翻译
BigChainDB:可扩展区块链数据库这篇白皮书介绍BigChainDB。BigChainDB填补了去中心生态系统中的一个空白:是一个可用的去中心数据库。它具有每秒百万次写操作,存储PB级别的数据和亚秒级响应时间的性能。BigChainDB的设计起始于分布式数据库,通过创新加入了很多区块链的特性,像去中心控制、不可改变性、数字资产的创建和移动。BigChainDB继承了现代分布式数据库的特性:吞...
2018-03-21 10:05:26 5310
转载 为什么要做用户行为分析?
一、什么是用户行为?用户行为由最简单的五个元素构成:时间、地点、人物、交互、交互的内容。(一)什么是用户行为?对用户行为进行分析,要将其定义为各种事件。比如用户搜索是一个事件,在什么时间、什么平台上、哪一个ID、做了搜索、搜索的内容是什么。这是一个完整的事件,也是对用户行为的一个定义;我们可以在网站或者是 APP 中定义千千万万个这样的事件。有了这样的事件以后,就可以把用户行为连起来观察。用户首次...
2018-03-19 16:33:09 5201
转载 不均衡数据怎么破?对付它的七种武器!
先问大家一个问题:银行欺诈识别、市场实时交易、网络入侵检测等领域的数据集,有哪些共通点?答案是:“关键”事件在数据中的占比经常少于1%(例如:信用卡行骗者、点击广告的用户或被攻破的服务器的网络扫描)。然而,大多数机器学习算法在不均衡数据集的表现都不太好。以下七种技术可以帮到你,训练一个分类器用于检测不正常类别数据。 1. 使用正确指标评估权值对于不均衡数据生成的模型,使用不恰当的评估方法很危险。架...
2018-03-12 09:58:41 558
转载 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营——————————————————————————————————————————一、风控建模流程以及分类模型建设1、建模流程该图源自课程讲义。主要将建模过程分为了五类。数据准备、变量粗筛、变量清洗、变量细筛、建模与实施。2、分类模型种类与区别风控与其他领域一样,分类模...
2018-03-08 20:20:08 961
转载 ks值和auc值的关系
要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的。其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已。拿逻辑回归举例,模型训练完成之后每个样本都会得到一个类概率值(注意是类似的类),把样本按这个类概率值排序后分成10等份,每一份单独计算它的真正率和假正率,然后计算累计概率值,用真正率和假正率的累计做为坐标画出来的就是ROC曲线,用...
2018-03-01 15:14:43 20566 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人