自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 因子分解机(FM)家族

写在前面的话  在深度学习(Deep Learning,以下简称DL)大行其道的今天,因子分解机(Factorization Machines,以下简称FM)以其模型简单、可解释性强等优点在搜索广告与推荐算法领域中仍旧占有一席之地。笔者认为FM开拓出了两个新思路:首先就是在线性复杂度范围内实现二阶特征的自动组合;再者就是embedding思想的引入,这其实是作者始料未及的(FM原文中作者意图是通...

2019-06-24 21:24:37 3319 9

原创 Ensemble Tree模型(随机森林RF、AdaBoost、GBDT、XgBoost、Lightgbm)灵魂20问

Bagging和Boosting方法有什么区别?从方差和偏差角度如何理解?Bagging的采样是如何进行的,是有放回还是无放回?什么是袋外数据OOB?随机森林一般采用哪种树模型来作为弱分类器?其在常规Bagging基础上做了哪些改进?CART树对于分类和回归问题采用的节点分裂准则是什么?随机森林的优点和缺点有哪些?AdaBoost的核心思想是什么?具体过程是怎么实现的?如何从模型、算...

2019-10-06 23:56:37 907

原创 协同过滤与矩阵分解灵魂13问

item-based CF和user-based CF有何区别?相似度计算方法都有哪些?协同过滤算法的优点和缺点都有哪些?什么是隐式反馈?针对具体业务是如何考虑使用item-based还是user-based的CF算法?CF冷启动问题的解决方法都有哪些?矩阵分解的核心思想是什么?本质上是什么?隐向量的维度k取值大概范围是?矩阵分解如何转换成机器学习问题?针对于矩阵分解的最优化问...

2019-10-04 17:27:04 241

原创 逻辑斯蒂回归LR的灵魂5问

几率有什么实际的意义?对数几率logit呢?在介绍LR之前都要介绍对数几率,为什么呢?sigmod激活函数的意义?为什么采用它?LR参数估计采用的方法是?其具体的推导过程?LR的损失函数是什么?怎么由极大似然估计推导出来?LR机器学习的三要素都是什么?...

2019-10-04 09:12:05 151

原创 支持向量机SVM的灵魂17问

SVM麻雀虽小,五脏俱全,从机器学习的三要素都涉及到且还包括凸优化、KKT,对偶等知识,下面总结一下SVM在面试中经常会被问到的问题?SVM的分类函数是什么,超平面是什么,分类标签是什么?函数间隔是什么?,几何间隔是什么?,他们各自有什么数学上的直观意义?它们之间关系是怎样的?为什么再有了函数间隔基础上还要提出几何间隔?SVM的优化目标是什么?在此优化目标下,能保证什么,不能保证什么?为...

2019-10-04 01:08:29 181

原创 in-place题小结

最近做了LeetCode上的两道题,题面不难,但是要求实现in-place实现,也就是O(1)的空间复杂度还是需要有点技巧。LeetCode 75.Sort Colors 要求在O(1)的空间复杂度内one-pass实现数组内的0、1、2的排序。 void sortColors(vector<int>& nums) { if (nums.size() == ...

2019-08-24 12:41:14 148

原创 记一道完美体现出数据结构高大尚的字节跳动算法题

偶然在公众号里看到今日头条的一道算法题(如下图),一共有三道题,要求40分钟内做完其中的两道(听说头条的面试一般都比较变态)。在网上找了找答案感觉都比较繁琐,自己当时也就没当回事就不准备做了。过了半个小时突然灵机一动,想到一种非常清晰的思路来做这道题—用环形链表来做。第一次遍历构建环形链表,并且算出周长。第二次遍历根据当前节点与下一个节点的距离来计算等分点的位置,同时将等分点作为新节点插入环形...

2019-08-24 11:48:20 663

原创 数据结构与算法题

1. Longest Substring Without Repeating Characters(LeetCode-3)  题意为在字符串中找出没有重复字符的最长连续子字符串。采用哈希表,用一个256维的vector来存储字符出现的位置,用left来记录不重复子串的左边位置,O(n)一次遍历,如果该字符之前出现过,更新left。  考察点:哈希表思想、字符串左右边界更新、一次O(n)遍历。...

2019-08-11 12:35:26 629

原创 算法岗面试基础知识必会60道题之(1)——梯度下降法、牛顿法与拟牛顿法的联系与区别

https://www.cnblogs.com/shixiangwan/p/7532830.html

2019-07-26 21:32:21 1162

原创 把这些链表题做透,就能秒杀面试中的链表题

链表题作为面试中的常常常客,没有什么诀窍,也没有什么超难题。只要吃饱饭、睡好觉、思路清晰就能做出来。Leetcode2: Add Two NumbersLeetcode19: Remove Nth Node From End of ListLeetcode24: Swap Nodes in PairsLeetcode61: Rotate ListLeetcode83: Remove ...

2019-07-02 22:41:59 137

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除