面试
视界IT
这个作者很懒,什么都没留下…
展开
-
面试(4):参数模型与非参数模型
参数模型与非参数模型1、概述2、参数机器学习算法3、非参数机器学习算法1、概述 LR是参数模型,SVM是非参数模型。 参数模型、非参数模型(以及半参数模型)的概念应该源自于统计学中。统计专业课程《非参数统计》研究的对象就是秩检验、核密度估计等。 在统计学中,参数模型通常假设总体(随机变量)服从某一个分布,该分布由一些参数确定(比如正态分布由均值和方差确定),在此基础上构建的模型称...转载 2019-06-25 14:05:56 · 729 阅读 · 0 评论 -
SQL(12) 抽样取数
sql 刷题1、抽样取数1、抽样取数表结构为user_id,reg_time,age, 写一句sql按user_id随机抽样2000个用户 写一句sql取出按各年龄段(每10岁一个分段,如(0,10))分别抽样1%的用户1)随机抽样2000个用户select * from table order by rand() limit 20002)取出各年龄段抽样1%的用户set @tar...转载 2019-07-28 11:21:20 · 5404 阅读 · 0 评论 -
SQL(11) 留存率+流失率!=100%
留存率+流失率1、留存率2、平均登陆和连续登陆3、次日留存率,3日留存率,7日留存率1、留存率 在解释“DAU(日活跃用户)/MAU(月活跃用户)”的时候,我们科学的认为“用户不可能天天登陆”,但在判定新用户是否留存的时候我们却很武断的认为“只有在取样点(第二、三或七天)登陆才算是流存”,这显然是没有把理智的思维观贯穿始终。 我们过去一直说的次日留存率、三日留存率、七日留存率并不是严格意...原创 2019-08-26 23:46:23 · 7056 阅读 · 1 评论 -
推荐系统冷启动问题——如何给新用户推荐商品,如何将新商品推荐给老用户
推荐系统冷启动问题——如何给新用户推荐商品,如何将新商品推荐给老用户1、推荐系统2、冷启动2.1 用户冷启动2.2 物品冷启动2.3 系统冷启动1、推荐系统 推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件。很多在开始阶段就希望有个性化推荐应用的网站来说,如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐...原创 2019-08-04 13:22:41 · 1883 阅读 · 0 评论 -
面试(9):朴素贝叶斯
特征选择与特征提取(降维)1、朴素贝叶斯为什么”朴素“2、简要说说贝叶斯定理(推导)3、半朴素贝叶斯与朴素贝叶斯1、朴素贝叶斯为什么”朴素“ 因为它假定所有特征在数据集中的作用是同样重要和相互独立的。这个假设在现实世界中是很不真实的,因此,说朴素贝叶斯很“朴素”。朴素贝叶斯模型假设样本特征彼此独立。这个假设现实中基本上不存在, 但特征之间有较小的相关性,这在现实生活中普遍存在,因此朴素贝叶...原创 2019-07-24 17:39:27 · 294 阅读 · 0 评论 -
面试(11) A/B test
A/B test1、概念2、统计学应用3、中心极限定理4、ABTest实验结果举例1、概念 A/B测试目的:快速验证新版本是否比旧版本好。 例如:对于商品详情页进行改版,希望提升商详版到支付页的比例。 采用抽样验证:选一定比例的用户(对照组)使用A版本统计日均PV,UV,日均页面转化率,再选一定比例的用户(实验组)使用B版本统计日均PV,UV,日均页面转化率。用样本去体现总体。2、...原创 2019-07-29 10:58:35 · 3120 阅读 · 0 评论 -
面试(3):集成学习bagging和boosting的区别
逻辑回归(LR)与支持向量机(SVM)的区别和联系1、为什么常比较这两个算法2、Bagging3、Boosting4、Bagging与Boosting的区别5、总结1、为什么常比较这两个算法 Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将...转载 2019-06-24 15:36:54 · 552 阅读 · 0 评论 -
面试(2):LR逻辑回归与损失函数理解
LR逻辑回归与损失函数理解1、LR的推导2、损失函数2.1 对数损失函数:2.2 平方损失函数:2.3 指数损失函数:2.4 Hinge损失函数:2.5 0-1损失函数:2.6 绝对值损失函数:1、LR的推导 LR逻辑回归是一种监督学习分类算法,其实现了给定数据集到0,1的一种映射。 给定数据集D={(x1,y1),(x2,y2)…(xm,ym)}\mathrm{D}=\{(x 1, y...转载 2019-06-23 13:59:27 · 6490 阅读 · 0 评论 -
面试(1):逻辑回归(LR)与支持向量机(SVM)的区别和联系
逻辑回归(LR)与支持向量机(SVM)的区别和联系1、为什么常比较这两个算法2、二者相同点3、二者不同点1、为什么常比较这两个算法(1)这两个算法是基础算法,常被使用。(2)LR与SVM之间有很多相似点,因此常被放在一起比较。2、二者相同点 第一,LR和SVM都是分类算法。 LR和S...原创 2019-06-23 10:04:39 · 4933 阅读 · 0 评论 -
面试(10):欧氏距离和曼哈顿距离、K-means和EM算法对比
欧氏距离和曼哈顿距离、K-means和EM算法对比1、欧式距离和曼哈顿距离2、K-means和EM算法比较1、欧式距离和曼哈顿距离 欧式距离用于计算两点或多点之间的距离。d(x,y)=(x1−y1)2+(x2−y2)2+⋯+(xn−yn)2=∑i=1n(xi−yi)2d(x, y) =\sqrt{\left(x_{1}-y_{1}\right)^{2}+\left(x_{2}-y_{2}...原创 2019-07-28 20:39:37 · 6090 阅读 · 0 评论