Yummy

数学是基础、编程是工具、算法才是利器

CTR预估之Deep Interest NetWork模型原理详解

本文介绍的Deep Interest NetWork是阿里妈妈盖坤带领的团队2018年8月发表在KDD的Paper,在点击率预估等场景有不错的效果。由于最近团队也准备尝试下该模型,因此提前熟悉下DIN的原理与实现。 引言 点击率预估在搜索、推荐、广告等领域具有很广泛及成功的应用,众多学者和...

2018-12-14 18:49:21

阅读数:310

评论数:0

《基于行列式点过程的推荐多样性提升算法》原理详解

本文将详细讲解Hulu在NIPS 2018 会议上发表的《Fast Greedy MAP Inference for Determinantal Point Process to Improve Recommendation Diversity》中,提出的基于行列式点过程的推荐多样性提升算法。 ...

2018-12-06 20:15:18

阅读数:265

评论数:3

快速求解exp方法

开发线上项目时,效率往往是一个十分重要的指标。程序在计算指数exp时,一般是通过泰勒展开近似的,为了保证精度,所展开的泰勒项特别多。因此,exp的求解是十分耗时的。下面,提供一种快速求解exp的方法。 double fast_exp(double x){ double d; // 先将...

2018-12-13 20:53:54

阅读数:48

评论数:0

广告CTR预估相关模型汇总

一、FM、FFM  FM:Factorization Machines  FFM:Field-aware Factorization Machines for CTR Prediction 二、DeepFM  DeepFM:DeepFM: A Factorization-Machine b...

2018-12-08 23:45:13

阅读数:13

评论数:0

C中int8_t、int16_t、int32_t、int64_t、uint8_t、size_t、ssize_t区别

工作中经常碰到int8_t、int16_t、int32_t、int64_t、uint8_t、size_t、ssize_t等数据类型,所以有必要对此进行梳理。 int_t同类 int_t 为一个结构的标注,可以理解为type/typedef的缩写,表示它是通过typedef定义的,而不是一种新的...

2018-12-04 12:05:06

阅读数:42

评论数:0

C++ STL系列之boost:unordered_map和std::map区别详解

开发C++时,选择合适的数据结构是一个十分重要的步骤。因此,必须对每一个数据结构的原理及应用场景都有所了解。 boost::unordered_map和std::map都是一种关联式容器,且原理类似,通过存储key-value键值对,可通过key快速检索到value,并且key是不重复的。但是,...

2018-12-04 11:00:15

阅读数:21

评论数:0

C++中数组和指针之间的关系梳理

C++中数组和指针是两个十分常用且关系密切的数据结构,“数组即指针,指针即数组”的言论一直层出不穷。从本质上讲,数组和指针是不同的,数组是具有确定数量的元素,而指针只是一个标量值。但是,在某些情况下数组和指针又能相互转换。下面,将从多个角度分析数组和指针。 1. 数组和指针互相转换 数组能在指...

2018-12-02 15:29:04

阅读数:133

评论数:0

C++ memset初始化对象注意点

C语言,在利用struct进行数据封装时,经常会使用memset(this,0,sizeof(*this))来初始化。而C++中,有时候也会用到struct,在利用memset进行初始化时,非常容易踩坑,有些地方需要注意。 C++利用memset初始化struct注意点 1. memset 是...

2018-11-30 17:23:25

阅读数:63

评论数:0

C语言中strtod与strtol的区别

strtod与strtol都是C/C++中常用的将字符数组转换成数组型常用的函数,但是它们也有一定的区别(C++真是让人又爱又恨)。 strtod用法 定义:double strtod (const char* nptr, char** endptr); 参数:nptr为待转换的字符数组,e...

2018-11-30 15:25:30

阅读数:16

评论数:0

广告点击率CTR修正-Wilson CTR

CTR(Click-Through-Rate)即点击通过率,指网络广告的点击到达率。CTR是广告推荐系统中,一项重要的衡量算法好坏的指标。 计算公式:  CTR = 点击数 / 曝光数 由于原始CTR计算方式只考虑了相对值,没有考虑绝对值。即,没有考虑曝光的数值大小,因为,曝光少的情况下,计算...

2018-11-29 16:55:29

阅读数:52

评论数:0

GDB调试进阶 - 动态调度pid进程

开发机中编译带debug信息的动态库            cd jd_search_rank            mkdir debug            cd debug            cmake -DCMAKE_BUILD_TYPE=Debug ..          ...

2018-11-27 17:53:19

阅读数:22

评论数:0

GDB 调试工具入门

GDB是GNU开源组织发布的一个强大的UNIX下的程序调试工具,通常在服务器上开发C/C++时,该工具是必不可少的。下面,将通过例子详细介绍GDB的使用。 1. 源程序  #include<iostream> using namespace std...

2018-11-23 15:08:15

阅读数:14

评论数:0

JetBrains系列集成软件多行代码缩进

在使用JetBrains旗下的集成软件,如IDEA, Pycharm, PhpStorm,Clion等时,通常需要整体向前或者向后缩进代码,以更加美观地编写代码。此时,可通过以下两个快捷键实现该功能: 1.代码整体向后缩进:       选中多行代码 -  按下tab键 2.代码整体向前缩进...

2018-11-02 14:17:06

阅读数:96

评论数:0

Python Tornado 异步处理实现

本文将叙述如何利用线程池的方式实现Tornado的异步处理。 1. 异步处理方案        在处理请求应用上加上@tornado.web.asynchronous和@tornado.gen.engine装饰器,即可实现异步方法配合实现非阻塞请求处理。请求上加了这两个装饰器,@tornado...

2018-10-31 21:38:20

阅读数:105

评论数:0

Pig实现order by limit功能

下面,将介绍如何利用Pig实现按多个值排序,并取每个组的前n个值。例如,取每个商品曝光前2的搜索词。 1. 文本数据 sku1,query11,pos11,50 sku1,query12,pos12,40 sku1,query13,pos13,20 sku2,query21,pos21,40...

2018-10-29 15:13:00

阅读数:34

评论数:0

Linux 运行带参数的cpp程序

g++ -std=gnu++0x main.cpp SpookyV2.cpp -o main ./main 123  4344

2018-10-26 18:59:46

阅读数:85

评论数:0

C++中const关键字详解

const关键字作用    1. 修饰变量        用法:const 类型说明符 变量名。        含义:说明该变量不可以被改变。        用途:常量命名等    2. 修饰引用        用法: const 类型说明符 &引用名。   ...

2018-10-19 18:24:50

阅读数:30

评论数:0

C++学习资源

C++常用语法总结(推荐)      https://github.com/huihut/interview

2018-10-18 17:58:04

阅读数:20

评论数:0

Pig解决MapReduce数量少,执行数据慢

当执行Pig脚本,出现Map的数量极小,但是执行速度慢时。可以通过适当减小set pig.maxCombinedSplitSize的值来增加map的数量,从而加快执行速度。 因为,本地执行job占全部job的比例越高,则执行速度越快。 在MapReduce Application 监控web页...

2018-10-11 11:42:24

阅读数:90

评论数:0

CURL日常使用总结

curl命令是一个利用URL规则在命令行下工作的文件传输工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。 1. 获取页面内容      当不加任何参数时...

2018-09-29 16:22:45

阅读数:28

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭