2019年10大机器学习Q&A,面试必知!

点击上方“AI算法与图像处理”,选择加"星标"或“置顶”

重磅干货,每天 8:25 送达640?wx_fmt=jpeg

来源:读芯术

已授权转载,禁止二次转载

640?wx_fmt=png

全文共1479字,预计学习时长3分钟


640?wx_fmt=jpeg
图片来源: https://unsplash.com/@danielcgold

新兴技术风靡全球,它们所带来的创新、机遇和威胁也是前所未有的。而这些领域所需要的专家人才也随之增长。

根据最新的行业报告显示,新兴技术领域的工作,如机器学习、人工智能和数据科学等,是最热门的新兴职业。从事此类新兴技术工作既能获得丰厚的利润,又能开发智力。

本文整理了一些最常见的机器学习面试问题及其相应的回答。机器学习有志者以及经验丰富的ML专业人员可以在面试前以此巩固其基础知识。

1. 机器学习和深度学习有什么区别?

机器学习是人工智能的一个子集,为机器提供了无需任何显式编程就能自动学习和改进的能力。而深度学习是机器学习的一个子集,其人工神经网络能够做出直觉决策。

2. 如何理解召回率和精度这两个术语?

召回率又称真阳性率,是模型所需的阳性例数与整个数据中可用阳性例数的比值。

精度基于预测,又称阳性预测值,是模型所需的准确阳性例数测量值与模型实际需要的阳性例数之间的比值。

3. 监督机器学习和无监督机器学习有什么区别?

在监督学习中,机器在标记数据的帮助下进行训练,即带有正确答案标记的数据。而在无监督机器学习中,模型自主发现信息进行学习。与监督学习模型相比,无监督模型更适合于执行困难的处理任务。

640?wx_fmt=jpeg
图片来源: https://unsplash.com/@brookelark

4. 什么是K-means和KNN?

K-means是一种用于处理聚类问题的无监督算法,KNN或K近邻是一种用于处理回归和分类的监督算法。

5. 造成分类不同于回归的原因是什么?

这两个概念都是监督机器学习技术的一个重要方面。分类将输出划分为不同的类别进行预测。而回归模型通常用于找出预测和变量之间的关系。分类和回归的关键区别在于,前者的输出变量是离散的,而后者是连续的。

6. 如何处理数据集中的缺失值?

数据科学家面临的最大挑战之一与数据丢失问题有关。可以通过多种方式对缺失值进行归因,包括分配唯一类别、删除行、使用均值/中值/众数替换、使用支持缺失值的算法以及预测缺失值等等。

7. 如何理解归纳逻辑编程(ILP)?

归纳逻辑编程是机器学习的子领域,通过使用逻辑编程开发预测模型来搜索数据中的模式。该过程假定逻辑程序是一种假设或背景知识。

640?wx_fmt=jpeg
图片来源: https://unsplash.com/@timmossholder

8. 需要采取哪些步骤来防止特定模型出现过拟合问题?

在训练中得到大量数据时,模型开始学习数据集中的干扰信息和其他错误数据。这使得模型难以泛化除训练集外的新样本。有三种方法可以避免机器学习中的过拟合。第一,保持模型简单;第二,使用交叉验证技术;第三,使用正则化技术,例如LASSO。

9. 什么是集成学习?

集成方法又称多学习器系统或基于委员会的学习 。集合方法是一种学习算法,能构建分类器集,再分类新数据,对其预测进行选择。该方法训练了许多假设以解决相同的问题。集成建模的最佳示例是随机森林,其中许多决策树用于预测结果。

10. 机器学习项目中需要哪些步骤?

要实现一个好的工作模型,需要采取的关键步骤是收集数据、准备数据、选择机器学习模型、模型训练、评估模型、调整参数,最后是预测。

640?

有热门推荐?

1.

2.

3.

加群交流

640?wx_fmt=png
你点的每个“在看”,我都认真当成了喜欢

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BAT机器学习面试1000题系列 1 前言 1 BAT机器学习面试1000题系列 2 1 归一化为什么能提高梯度下降法求解最优解的速度? 22 2 归一化有可能提高精度 22 3 归一化的类型 23 1)线性归一化 23 2)标准差标准化 23 3)非线性归一化 23 35. 什么是熵。机器学习 ML基础 易 27 熵的引入 27 3.1 无偏原则 29 56. 什么是卷积。深度学习 DL基础 易 38 池化,简言之,即取区域平均或最大,如下图所示(图引自cs231n) 40 随机梯度下降 46 批量梯度下降 47 随机梯度下降 48 具体步骤: 50 引言 72 1. 深度有监督学习在计算机视觉领域的进展 73 1.1 图像分类(Image Classification) 73 1.2 图像检测(Image Dection) 73 1.3 图像分割(Semantic Segmentation) 74 1.4 图像标注–看图说话(Image Captioning) 75 1.5 图像生成–文字转图像(Image Generator) 76 2.强化学习(Reinforcement Learning) 77 3深度无监督学习(Deep Unsupervised Learning)–预测学习 78 3.1条件生成对抗网络(Conditional Generative Adversarial Nets,CGAN) 79 3.2 视频预测 82 4 总结 84 5 参考文献 84 一、从单层网络谈起 96 二、经典的RNN结构(N vs N) 97 三、N VS 1 100 四、1 VS N 100 五、N vs M 102 Recurrent Neural Networks 105 长期依赖(Long-Term Dependencies)问题 106 LSTM 网络 106 LSTM 的核心思想 107 逐步理解 LSTM 108 LSTM 的变体 109 结论 110 196. L1与L2范数。机器学习 ML基础 易 163 218. 梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?深度学习 DL基础 中 178 @李振华,https://www.zhihu.com/question/68109802/answer/262143638 179 219. 请比较下EM算法、HMM、CRF。机器学习 ML模型 中 179 223. Boosting和Bagging 181 224. 逻辑回归相关问题 182 225. 用贝叶斯机率说明Dropout的原理 183 227. 什么是共线性, 跟过拟合有什么关联? 184 共线性:多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确。 184 共线性会造成冗余,导致过拟合。 184 解决方法:排除变量的相关性/加入权重正则。 184 勘误记 216 后记 219

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值