yichudu

技术博客

TensorFlow 常用类与方法

简述 Google开源, 支持包括CNN、RNN、LSTM等多种神经网络模型. API 快速参考点 这里. 国内环境可以访问 google 的cn站点, 点 这里。 graph 与 session graph 与 session, 前者是静态的神经网络计算图; 后者是有数据流动的动态...

2017-08-16 09:59:03

阅读数 832

评论数 1

最优化算法 总述

Newton method牛顿法.Quasi-Newton拟牛顿法.BFGSBFGS, Broyden–Fletcher–Goldfarb–Shanno algorithm.L-BFGSL-BFGS,Limited-Memory BFGSOWL-QNOWL-QN,Orthant-Wise Limi...

2017-06-26 09:30:25

阅读数 1067

评论数 0

transformer 翻译模型及 bert

transformer google 出品, 基于 encoder-decoder 架构的 seq2seq 自然语言翻译模型. paper 见参考[1]. 创新之处是弃用 RNN,CNN 这样的结构, 采用 self-attention 与 positional-encoding 来简化结构, 加...

2019-04-21 23:33:36

阅读数 71

评论数 0

side_info 类协同过滤

传统的协同过滤 只用日志中出现过的id来计算, 有冷启动问题. 加入了 side_info, 就可以增强泛化性, 缓解冷起问题. side info是指user与item侧, 每个id所附带的一些属性, 如 user: 年龄, 性别, 偏好. item: 价格, 热度, 类目, 品牌等. FM...

2019-04-20 15:21:53

阅读数 7

评论数 0

gdb 使用

分析 core 核心转储文件 程序崩溃时, 会有核心转储文件生成, 方便定位有异常的栈. 下面这个例子中, #6位置有空指针, 所以异常. $gdb binary/home/admin/d2_runtime/bin/sap_server_d suez_worker/core-500-sap_ser...

2019-03-21 10:52:43

阅读数 18

评论数 0

Docker for windows 常用操作

安装 win 10 系统可用. 以下操作均可在console中完成. 容器管理 初次安装并启动 --name 容器中的用户账户名 --net=host 使用本机网络 -v a:b 本地磁盘与容器文件系统的映射. windows盘符的d:需要转换为/d/. -it 分配一个伪中断, 使用标准输入...

2019-03-15 15:29:13

阅读数 38

评论数 0

WSL, Windows 中运行 linux 子系统

WSL, Windows Subsystem for Linux. 安装 网上很多教程. 见参考[1] . Microsoft Store | 搜索 linux | ubuntu 设置 | 安全 | 启用开发人员模式 运行 | optionalfeatures.exe | 启用或关闭windo...

2019-03-14 15:02:02

阅读数 24

评论数 0

使用latex写算法伪代码

伪代码具有通用(编程语言无关), 简洁(数组越界,判空什么的都可省去)的特点, 是用来描述算法过程的好工具. 基于latex使用algorithm2e 这个包可以清晰地得到pdf格式的伪代码. 参考 pdf官方文档,algorithm2e ...

2019-02-11 14:08:28

阅读数 157

评论数 0

Latex in KeTex 模板

参考 supported functions-katex 例子 通用 E=mc2E=mc^2E=mc2 分段函数 x={aif bcif dx = \begin{cases} a &\text{if } b \...

2019-01-22 14:59:48

阅读数 61

评论数 0

机器学习相关会议

NeurIPS Neural Information Processing Systems. https://nips.cc/ ICML International Conference on Machine Learning. https://icml.cc/ IJCAI Internation...

2019-01-16 14:48:07

阅读数 78

评论数 0

线性模型中的特征工程

LR 模型靠特征的共现, 来记住它们对ctr的贡献. 除去常规的特征交叉, 还要有一些ctr类的统计数据, 罗列见下. item 侧 不同维度下, 多个内容的整体消费差异 一个类目下,所有内容的ctr 一个商铺下,所有内容的ctr 不同维度下, 一个内容的消费差异 一个内容, 在不同性别/年龄人群...

2018-12-26 15:22:44

阅读数 110

评论数 0

推荐系统数据集

RecSys 2015 见参考[1]. RecSys Challenge 2015. 一家电商网站的点击和购买日志. train set Session ID, Timestamp ,Item ID ,Category ,Price , Quantity (how many of this it...

2018-12-11 11:14:25

阅读数 623

评论数 0

点击率 ctr 与停留时长 dwell time

参考 JUMP: A Joint Predictor for User Click and Dwell Time

2018-12-05 14:27:21

阅读数 178

评论数 0

点击率 ctr 与转化率 cvr

概念定义 在广告和推荐场景中, 用户首先会看到平台给他生成的推荐结果, 称为曝光(impression), 用户会有一定的概率作点击(click), 进入详情页. 若果满意的话会购买产品, 称为转化(conversion). CTR Click Through Rate. 点击率. pCTR=p...

2018-12-03 14:39:24

阅读数 648

评论数 0

推荐系统的多样性

背景 如果是用 point-wise 的方法, 根据ctr做倒排, 会出现 high similar items were clustered together 的现象. 相似的item扎堆, 这种体验并不友好. submodular diversification 参考 [Adaptive, ...

2018-10-12 10:35:59

阅读数 735

评论数 0

parameter server 简介

ps 是一种分布式机器学习的编程框架. 该思想在[1]中被提出, git上的一个实现见[3]. 参考 parameter_server_osdi14.pdf Parameter Server 详解 github,ps-lite

2018-07-23 13:55:42

阅读数 396

评论数 0

推荐系统中的矩阵分解(MF,FM,FFM)

在推荐场景中, 我们可以把user对item的行为, 用评分矩阵R∈R|U|×|P|R∈R|U|×|P|R\in \mathbb R^{|U|\times|P|}表示. UUU为用户集合, PPP为item集合, 以商品为例. 比如说用户u1对商品p1加购物车, 那就令 Ru1,p1=3Ru...

2018-07-04 14:33:17

阅读数 413

评论数 0

推荐系统的冷启动

冷启动即新加入的user或item, 在 user-item 二部图中, 新节点的度是0, 所以针对它们如何推荐, 就称为冷启动问题. 包括 user,item 两部分的冷启动. 参考 RecSys2016,paper, Addressing Cold Start for Next-...

2018-07-02 20:15:05

阅读数 349

评论数 0

知识图谱表示学习

知识图谱是一种精细化的异构网络, 所以对其节点与边的表示学习也是一个热门的问题. 这里的学习依旧是得到它们的低维稠密向量. 参考 论文transr

2018-06-26 10:49:03

阅读数 1011

评论数 0

网络表示学习 常用数据集

Zachary’s karate club 一个大学空手道俱乐部的社交关系图, 很多论文中都喜欢用它做例子. 这个图比较简单, 有34个节点, 78条边. youtube 2 数据集介绍见[2]. node有两种, personpersonperson 与 groupgroupgrou...

2018-06-21 14:53:56

阅读数 848

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭