深度兴趣网络模型探索——DIN+DIEN+DSIN

目录 DIN 背景 din模型结构提出 自适应正则提出 相关延伸 系统概述 推荐流程介绍 特征工程 基本模型结构 DIN模型 自适应正则 DIEN 背景 DIEN模型提出 DIEN关键点 DIEN模型 兴趣提取层 兴趣演化层 DIEN模型结构 DSIN 背...

2019-06-10 23:33:20

阅读数 64

评论数 0

feed流个性化推荐架构和算法分享

目录 一、场景 1.应用场景 2.feed流资讯应用场景 二.架构 1. 物理架构 2.逻辑架构 三、召回算法 1.用户画像 2. tag热度(tagCtr) 3. LBS/时间轴 4.关键词标签 5.主题标签 6.语义标签 7.协同过滤 8.SimRank 9. ...

2019-05-05 21:47:38

阅读数 126

评论数 0

计算广告——读书笔记(二)

在计算广告——读书笔记(一)中,主要从产品角度介绍,而本篇从技术角度,继续介绍广告业务。 一、计算广告技术概述 1. 个性化系统框架 一般个性化系统由四部分组成:用于实时响应请求,完成决策的在线投放(online serving)引擎,离线的分布式计算(distributed computi...

2019-04-05 18:56:29

阅读数 136

评论数 0

计算广告——读书笔记(一)

目录 一、在线广告综述 1. 大数据和广告关系 2. 广告定义和目的 3. 在线广告创意类型 4. 在线广告简史 5. 泛广告商业产品 二、计算广告基础 1. 广告有效性原理 2. 互联网广告的技术特点 3. 计算广告的核心问题 3.1 广告收入的分解 3.2 结算方式与E...

2019-04-02 20:38:38

阅读数 250

评论数 0

基于K-均值的app列表聚类分析优化

目录 一、过滤词表筛选 二、模型更新 三、app类型处理 1. 统计app类型占比 2. 新增app类型特征 在基于K-均值的app列表聚类分析中,初步完成用户app列表特征聚类。我们在评估中发现以下几个问题: 某些同类用户app列表出现大量相同的国民app(如支付宝、微信、QQ、腾...

2019-03-06 11:59:26

阅读数 118

评论数 0

基于K-均值的app列表聚类分析

目录 一、工程实现 1. 提取稀疏向量 2. K-均值聚类 3. 踩过的坑 二、评估 在个性化推荐中,新用户冷启动问题一直是难题。一般做法是tagCtr、地域、时间轴等(用户画像单一维度)推荐,效果也挺不错的。其实,除了以上比较明显维度考量,用户app列表也隐藏着用户丰富个性化特征。不...

2019-02-27 20:55:14

阅读数 942

评论数 0

大规模分布式图学习框架Euler——安装和使用

目录 一、Euler介绍 1. 框架 2. 应用 2.1 大规模图的分布式学习 2.2 支持复杂异构图的表征 2.3 图学习与深度学习的结合 2.4 分层抽象与灵活扩展 3. 内置算法 二、Euler安装 1. 编译 2. Euler安装  2.1 PyPI安装 2.2 ...

2019-01-21 20:51:45

阅读数 806

评论数 1

基于deepwalk图嵌入的match解读

目录 一、deepwalk解读 1. deepwalk介绍 2. deepwalk优势 2.1 online学习 2.2 并行 2.3 信息缺失 2.4 graph embedding 3. deepwalk算法和流程实现 二、deepwalk在推荐应用 1. 目标 2. 代...

2019-01-08 21:07:49

阅读数 664

评论数 2

DBeaver 5.3.1安装和使用

目录 一、下载和安装 二、连接 1. mysql连接 2. hive连接 3. clickhouse连接 4. elasticsearch连接 5. neo4j连接 6. phoenix连接 6.1 hbase与phoenix整合 6.2 启动 6.3 测试 6.4 连接 ...

2019-01-02 22:14:39

阅读数 839

评论数 0

tensorflow 常用API总结

最近一边接手一些深度学习的项目,一边学习和消化。在review code时,查询了不少api,其中一些api由于tensorflow版本已经弃用,为此专门做了些修正,并总结下来。

2018-12-25 16:23:59

阅读数 690

评论数 0

spark优化指南

目录 一、代码优化 1. 基本原则 2. 算子优化 2.1 reduceByKey/aggregateByKey替代groupByKey 2.2 mapPartitions(foreachPartitions)替代map(foreach) 2.3 使用filter之后进行coalesc...

2018-11-21 18:57:54

阅读数 94

评论数 0

推荐系统FM & FFM算法解读与实践

在推荐系统和计算广告业务中,点击率CTR(click-through rate)和转化率CVR(conversion rate)是衡量流量转化的两个关键指标。准确的估计CTR、CVR对于提高流量的价值,增加广告及电商收入有重要的指导作用。业界常用的方法有人工特征工程 + LR(Logistic R...

2018-11-13 19:07:43

阅读数 2482

评论数 0

HBase优化指南

在Hbase2x 增删改查 scala版中,有介绍HBase1.2.x增删改查的api文档,但仅仅了解还是不够,在不同的读写业务场景中,必须做出适当优化,才能满足业务需求。本文首先讲解HBase缓存机制,并针对服务端(server)和客户端(client)进行调优说明。 一、HBase缓存机制 ...

2018-11-06 20:13:27

阅读数 240

评论数 0

tensorflow模型构建流程

在tensorflow中,构建模型流程比较程式化,有构建图表(Build Graph)和评估(evaluate)两部分,其中构建图表又分为:推理(Inference)、损失(Loss)、训练(train)。掌握了这些,对于快速上手工程开发很有帮助。 一、构建图表 1. 推理(Inference...

2018-11-03 16:40:27

阅读数 834

评论数 0

elasticsearch6.x ik中文分词集成

Elasticsearch是一个基于Apache Lucene(TM)的开源、实时分布式搜索和分析引擎。它用于全文搜索、结构化搜索、分析以及将这三者混合使用。IK Analysis插件将Lucene IK分析器集成到elasticsearch中,支持自定义词典。 1. 选择ik版本 IK版本安...

2018-10-24 18:12:06

阅读数 473

评论数 0

tensorflow之卷积神经网络

卷积神经网络CNN(convolutional neural networks,CNN)是一种类似于人工神经网络的深度学习模型或多层感知机,常用在图像分类、目标检测、图像语义分割等领域,随着大规模图像数据的产生以及计算机硬件(特别是GPU)的飞速发展,其强大的特征学习与分类能力引起了广泛的关注,具...

2018-10-23 21:27:07

阅读数 363

评论数 0

Graphviz神经网络的绘图

一、Graphviz安装 sudo apt-get install graphviz 二、神经网络绘图 创建并编辑nn.dot,新增如下 digraph G { rankdir = LR splines = line nodesep = .05 subgraph clust...

2018-10-18 20:14:23

阅读数 461

评论数 4

初始tensorflow

很早之前就听闻tensorflow大名,作为深度学习框架的明星产品tensorflow从诞生之初,就备受关注。作为入门小白,以后也会逐步学起,更新tensorflow认识和技能。 TensorFlow是Google开源的一款人工智能学习系统。为什么叫这个名字呢?Tensor的意思是张量,代表N维...

2018-10-17 11:23:29

阅读数 538

评论数 0

neo4j 3.4.7安装和使用

neo4j是目前最流行的图形数据库,支持完整的事务。在树形图中,图是有顶点、边和属性组成的,顶点和边都可以设置属性,顶点又称节点,边也叫做关系。每个节点和关系都可以由一个或多个属性,neo4j创建的图是用顶点和边构建一个有向图,其查询语言为cypher。 一、机器环境 ubuntu 18.04...

2018-09-30 10:08:44

阅读数 702

评论数 0

基于ItemBased和ALS的协同过滤推荐算法

基于邻域的算法是个性化推荐系统中最基本的算法,该算法不仅在学术界得到了深入研究,而且在业界得到了广泛应用。基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法。本文主要研究基于物品的协同过滤算法和基于ALS协同过滤算法。 一、基于物品的协同过滤算法 1.基本思...

2018-09-29 14:31:43

阅读数 280

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭