关闭

机器学习面试题

标签: 机器学习面试题
649人阅读 评论(0) 收藏 举报
分类:

目前我整理了一些机器学习面试题,欢迎大家留言给出正确答案!

1、LR为什么用sigmoid函数。这个函数有什么优点和缺点?为什么不用其他函数?

答:设计一个分类模型,首先要给它设定一个学习目标。在支持向量机中,这个目标是max-margin;在adaboost中,目标是优化一个指数损失函数。那么在logistic regression (LR)中,这个目标是什么呢?最大化条件似然度。考虑一个二值分类问题,训练数据是一堆(特征,标记)组合,(x1,y1), (x2,y2), …. 其中x是特征向量,y是类标记(y=1表示正类,y=0表示反类)。LR首先定义一个条件概率p(y|x;w)。 p(y|x;w)表示给定特征x,类标记y的概率分布,其中w是LR的模型参数(一个超平面)。有了这个条件概率,就可以在训练数据上定义一个似然函数,然后通过最大似然来学习w。这是LR模型的基本原理。

那么接下来的问题是如何定义这个条件概率呢?sigmoid函数就派上用场了。我们知道,对于大多数(或者说所有)线性分类器,response value(响应值) <w,x> (w和x的内积) 代表了数据x属于正类(y=1)的confidence (置信度)。<w,x>越大,这个数据属于正类的可能性越大;<w,x>越小,属于反类的可能性越大。<w,x>在整个实数范围内取值。现在我们需要用一个函数把<w,x>从实数空间映射到条件概率p(y=1|x,w),并且希望<w,x>越大,p(y=1|x,w)越大;<w,x>越小,p(y=1|x,w)越小(等同于p(y=0|x,w)越大),而sigmoid函数恰好能实现这一功能(参见sigmoid的函数形状):首先,它的值域是(0,1),满足概率的要求;其次,它是一个单调上升函数。最终,p(y=1|x,w)=sigmoid (<w,x>).

综上,LR通过最大化类标记的条件似然度来学习一个线性分类器。为了定义这个条件概率,使用sigmoid 函数将线性分类器的响应值<w,x>映射到一个概率上。sigmoid的值域为(0,1),满足概率的要求;而且是一个单调上升函数,可将较大的<w,x>映射到较大的概率p(y=1|x,w)。sigmoid的这些良好性质恰好能满足LR的需求。

2、决策树如何防止过拟合

答:

3、KKT条件用哪些,完整描述

答:

4、L1正则为什么可以把系数压缩成0,坐标下降法的具体实现细节.

答:

5、Python如何定义一个私有变量

答:

7、K-means聚类个数选择,做什么样的试验来确定K

答:

10、SVM怎么防止过拟合

答:

11、SVM原问题和对偶问题关系?

答:

13、为什么L1正则可以实现参数稀疏,而L2正则不可以?

答:

0
0
查看评论

不容错过的50道机器学习面试题及答案

转载自http://www.ppvke.com/Blog/archives/381751.什么是机器学习机器学习是为了应对系统程序设计,属于计算机科学类的学科,它能根据经验进行自动学习和提高。例如:一个由程序操纵的机器人,它能根据从传感器搜集到的数据,完成一系列的任务和工作。它能根据数据自动地学习应...
  • jiede1
  • jiede1
  • 2017-03-04 14:20
  • 3451

15道机器学习面试题,让你顺利得到offer!

DT时代,机器学习作为一门热门的科学研究项目,也成为了众多IT人想要进修或从事的领域。现在,大圣众包威客平台(www.dashengzb.cn)便为大家搜罗15道或常见或棘手的机器学习面试题目,让欲从事相关工作的IT人能够更加从容地走上机器学习专家之路。   问1:你会在时间序列数据集...
  • dashenghuahua
  • dashenghuahua
  • 2016-12-23 16:48
  • 7875

机器学习 常见面试题 总结

前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展...
  • vbskj
  • vbskj
  • 2016-08-03 21:21
  • 2121

常见机器学习面试题

参考:http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage# http://blog.csdn.NET/heyongluoyao8/article/details/4942962...
  • xbmatrix
  • xbmatrix
  • 2017-03-14 21:11
  • 5725

BAT机器学习面试题及解析(256-260题)

本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。前255题已发,后续请关注本公众号。 关于如何学习机器学习,最推荐机器学习集训营系列(点击文末“阅读原文”)。从Python基础、数据分析、爬虫,到数据可视化、s...
  • T7SFOKzorD1JAYMSFk4
  • T7SFOKzorD1JAYMSFk4
  • 2017-12-06 00:00
  • 194

BAT机器学习面试1000题系列(第1~325题)

BAT机器学习面试1000题系列整理:July、元超、立娜、德伟、贾茹、王剑、AntZ、孟莹等众人。本系列大部分题目来源于公开网络,取之分享,用之分享,且在撰写答案过程中若引用他人解析则必注明原作者及来源链接。另,不少答案得到寒小阳、管博士、张雨石、王赟、褚博士等七月在线名师审校。说明:本系列作为国...
  • v_JULY_v
  • v_JULY_v
  • 2017-09-28 11:37
  • 24465

【BAT机器学习面试题】前100题汇总及勘误(上)

来源:七月在线实验室ID:julyedulab  近期,七月团队整理了BAT机器学习面试1000题系列,侧重机器学习、深度学习。我们将通过这个系列索引绝大部分机器学习和深度学习的笔试面试题、知识点,它将是一个足够庞大的机器学习和深度学习面试库/知识库,通俗成体系且循序渐进。  今天将会发布【BAT机...
  • tkkzc3E6s4Ou4
  • tkkzc3E6s4Ou4
  • 2017-12-28 00:00
  • 395

2016校招百度美团360机器学习岗面试经历

今天下午在教室自习,顺便还投了一些公司,准备笔试面试,突然接到百度hr的电话,顺利拿到offer。期间,我有点屌丝地反复问她这个offer是确定的吧,不会被取消吧,因为前几天看到百度缩招的消息,哈哈,hr跟我确定这个offer不会变,就等着签三方了。lz是硕士,属于计算机相关专业,无实习经历。 ...
  • u014365862
  • u014365862
  • 2016-03-14 21:18
  • 3244

机器学习校招笔试

2013百度校园招聘-机器学习和数据挖掘工程师-笔试题 一、简答题(30分) 1、简述数据库操作的步骤(10分) 2、TCP/IP的四层结构(10分) 3、什么是MVC结构,简要介绍各层结构的作用(10分) 二、算法与程序设计(45分) 1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打...
  • u014568921
  • u014568921
  • 2015-05-31 10:13
  • 1699

百度机器学习/数据挖掘面试题K-means

昨天去面试百度的机器学习岗位,基本上从头到尾就在探讨K-means的一些问题。可惜之前我也几乎不用K-means,只了解K-means的大概思路,没有深究过其中的两个重要问题:一是初始点的选择;二是K值的选择。当时被问到这个问题头炸了,然后面试官就说,那你就在你没看过的情况下想想这两个问题应该怎么解...
  • wjj5881005
  • wjj5881005
  • 2016-09-23 09:33
  • 845
    机器学习公众号

    关注微信公众号,专

    为机器学习入门者
    个人资料
    • 访问:230959次
    • 积分:4762
    • 等级:
    • 排名:第7226名
    • 原创:115篇
    • 转载:14篇
    • 译文:3篇
    • 评论:788条
    博客专栏
    最新评论