自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 倒排索引

1. 何为倒排索引索引,初衷都是为了快速检索到你要的数据。每种数据库都有自己要解决的问题(或者说擅长的领域),对应的就有自己的数据结构,而不同的使用场景和数据结构,需要用不同的索引,才能起到最大化加快查询的目的。对 Mysql 来说,是 B+ 树,对 Elasticsearch/Lucene 来说,是倒排索引。ES是一个分布式的搜索与分析引擎,既然用MySQL也可以实现搜索的功能,那为什么还需要搜索引擎呢?A relational database can store data and also i

2021-01-18 20:48:47 156 1

原创 Installing Oracle 19c on RHEL 7.7

Installing Oracle 19c on RHEL 7.7PrerequisitesStep 1: Installing GNOME Desktopyum group listyum groupinstall 'Server with GUI'Check GNOME version:gnome-shell --versionStep 2: Creating Oracle required user & groupgroupadd dbauseradd oracleus

2020-07-10 19:31:56 464

原创 LeetCode 99 - Recover Binary Search Tree

LeetCode 99 - Recover Binary Search Tree题目链接:99. Recover Binary Search Tree传统 Stack + Iterative传统的Recursive或者Stack + Iterative解法的空间复杂度都是O(n)。class Solution { public void recoverTree(TreeNode root) { TreeNode first = null, second = null;

2020-07-10 14:01:14 198

原创 二分查找之魔鬼的后妈

二分查找之魔鬼的后妈Donald Knuth 在其著作 The Art of Computer Programming, Volume 3: Sorting and Searching 中提到,“虽然第一篇二分搜索的论文在1946年就发表了,但是第一个没有错误的二分搜索程序却直到1962年才出现。”《编程珠玑》的作者Jon Bentley曾经收集过学生的代码,发现其中有90%都是错的,甚至连以前java的库中,二分搜索也存在着一个隐藏了10年的严重bug。埋下这个bug的人,也正是Jon Bentley

2020-05-09 00:04:29 416

原创 推荐系统之深度会话兴趣网络DSIN

深度会话兴趣网络DSIN深度会话兴趣网络(Deep Session Interest Network,DSIN)是阿里发表在IJCAI 2019上的模型,Reference推荐系统论文DSIN:Deep Session Interest Network深度会话兴趣网络 DSIN推荐系统遇上深度学习(四十五)-探秘阿里之深度会话兴趣网络DSIN...

2020-04-14 18:05:14 766

原创 推荐系统之深度兴趣进化网络DIEN

深度兴趣进化网络DIEN深度兴趣进化网络(Deep Interest Evolution Network,DIEN)是阿里妈妈广告团队发表在AAAI 2019上的工作,是深度兴趣网络DIN模型的升级版。Motivation与搜索广告不同,在推荐系统中用户无需输入关键词来表达意图,因此捕捉用户兴趣并考虑兴趣的动态变化对提升模型效果来说十分关键。以Wide&Deep为代表的模型只考虑不同...

2020-04-12 11:05:13 1279

原创 推荐系统之深度兴趣网络DIN

深度学习推荐模型演化推荐系统和计算广告领域进入深度学习时代后,相比传统推荐模型在以下两方面取得了重大进展:(1) 与传统机器学习相比,深度学习模型的表达能力更强,能够挖掘出更多数据中潜藏的模式。(2) 深度学习的模型结构非常灵活,能够根据业务场景和数据特点,灵活调整模型结构,使模型与应用场景完美契合。深度学习推荐模型的演化图谱如下所示,以多层感知机MLP为核心,通过改变神经网络的结构,构建...

2020-04-06 18:52:05 1099

原创 推荐系统之DeepFM

DeepFM模型DeepFM 简介对于CTR而言,最重要的是学习到用户点击行为背后隐含的特征组合。在不同的推荐场景中,低阶组合特征或者高阶组合特征都可能会对最终的CTR产生影响。人工特征工程,通常会有两个问题:第一个是特征爆炸。以Poly-2模型为例,该模型采用直接对二阶特征组合建模来学习它们的权重,这种方式构造的特征数量跟特征个数乘积相关。比如某类特征有1w个可能的取值(如App),另一类...

2020-04-02 22:59:26 354

原创 场感知分解机FFM

碎碎念最近读FM、FFM、DeepFM的paper,整理知识点和原理,越来越感觉即使推导了公式,用LibFM、xlearn等在数据集上跑了,也始终心里没底,调包侠还是level太低。这种感觉就像是刷LeetCode,看了别人的代码,依然没把握面试时能写出bug-free的代码一样。工程实现!一定要敲一遍代码才算掌握!场感知分解机场感知分解机(Field-aware Factorization...

2020-03-30 12:20:54 459

原创 因子分解机FM

因子分解机因子分解机(Factorization Machine,FM),又称分解机,是由Steffen Rendle最早于2010年在论文ICDM:Factorization Machines中提出,旨在解决大规模稀疏数据下的特征组合问题。传统机器学习方法,假设各特征之间相互独立,没有考虑特征间存在相互作用的情况,主要关注如何对特征赋予权重的问题。FM 研究背景在实际应用中,Categor...

2020-03-28 17:26:34 720

原创 LeetCode 56 - Merge Intervals

AC Solutionclass Solution { public int[][] merge(int[][] intervals) { if (intervals == null || intervals.length <= 1) { return intervals; } Arrays.sort(inte...

2020-03-21 00:15:05 120

原创 推荐系统之召回策略浅析

写在前面的话本文为学习笔记,主要整理自参考文献中的文章。召回 & 排序目前业界推荐系统普遍采用召回+排序的两阶段模型,如图1.1所示。所谓召回(matching),指的是从全量信息集合中触发尽可能多正确的结果,并将结果返回给排序作为输入。相比搜索系统,推荐系统最大的不同在于用户没有明确的Query输入,即用户自身的需求是不明确的,推荐系统需要做的就是根据用户画像、内容画像等各种信息为...

2020-03-18 21:45:31 3318

原创 LeetCode 54 - Spiral Matrix

校招时刷题误区总结1. AC后上传到Github就不管了性价比很低,别人的solution不代表自己真正消化理解了,刷完不总结反思很容易遗忘,以致看submissions只记得自己AC过,而思路完全记不得。以后每周/双周/月,对最近AC的题目进行白板编程复习,温故而知新,检测标准就是做过的题目白板bug-free AC。2. 防御性编程上来先考虑corner case有哪几类,比如此题必然...

2020-03-18 15:56:34 76

原创 SVD系列算法

在上一篇奇异值分解原理浅析中,简单分析了SVD的矩阵分解原理。本文侧重分享下SVD算法及其变种在推荐领域中的应用,SVD算法最初是在Netflix竞赛中大放异彩,目前SVD及其变种主要包括FunkSVD、BiasSVD、SVD++以及timeSVD。FunkSVD算法传统的SVD矩阵分解要求矩阵必须是dense的,即不能有缺失值。而在实际的推荐系统中,User-Item评分矩阵RRR通常是非常...

2020-03-04 23:26:26 1855

原创 Setting up NFS on CentOS 7 / RHEL 7

NFS 简介NFS(Network File System),即网络文件系统。NFS的功能是通过网络让不同的机器、不同的操作系统能够共享文件,让应用程序在客户端通过网络访问位于服务器磁盘中的数据,是在类Unix系统间实现磁盘共享的一种方法。NFS使用RPC协议进行通信,即NFS系统是一组RPC程序。NFS可以看做一个RPC Server,主要功能是管理分享的目录和文件,不负责通信和信息传输,而...

2020-03-04 10:49:03 174

原创 Installing Db2 on-prem on CentOS 7

下载Db2 on-prem v11.5 安装包登录IBM官网,注册IBMid并登录,选择IBM Db2 Database。选择**IBM® Db2 11.5 for Linux® on AMD64 and Intel® EM64T systems (x64)**下载后SCP上传至服务器。解压并安装Db2 precheck依赖解压Db2安装包tar -zxvf v11.5_linuxx6...

2020-03-04 10:46:12 621

原创 奇异值分解SVD

写在前面的毒鸡汤所谓原创,只是个人对某一个知识点脉络的梳理。最近被F家的Slogan圈粉:Done is better than perfect.与所有的拖延癌君共勉。奇异值分解的定义与性质**奇异值分解(singular value decomposition,SVD)**是一种矩阵因子分解方法。任意一个m×nm\times nm×n矩阵,都可以表示为三个矩阵的乘积(因子分解)形式,...

2020-02-27 10:59:21 766

翻译 深入理解Linux内核-内核同步

内核抢占(kernel preemption)(Linux 2.6)抢占内核的主要特点:一个在内核态运行的进程,可能在执行内核函数期间被另外一个进程取代.抢占条件:1.只有当内核正在执行异常处理程序(尤其是系统调用),而且内核抢占没有被显式的禁用时,才可能抢占内核2.本地CPU必须打开本地中断,否则无法完成内核抢占.临界区是一段代码,在其他的

2015-01-16 22:50:28 457

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除