百面机器学习(笔记)
百面机器学习书籍笔记
东东就是我
抖音号79344055434
展开
-
《9.计算机视觉》
第一节:物体检测1.简述物体检测领域中的单步模型和两步模型的性能差异及其原因答:单步模型:SSD、YOLO 两步模型:R-CNN、SPPNet、Fast R-CNN、Mask R-CNN单步快,两步准2.两步模型的发展过程。答:SPPNet:金字塔池化Fast R-CNN: ROI POOLINGFater R-CNN :RPN3.简单介绍单步模型4.有哪些措施可以增强模型对于小物体的检测效果答:(1)模型设计方面:特征金字塔、沙漏结构;尽可能提升网络的感受野(2原创 2020-07-06 21:33:41 · 149 阅读 · 1 评论 -
《1。卷积神经网络》
第一节.卷积基础知识1.简述卷积的基本操作,并分析其与全连接层的区别答:具有局部连接和权值共享的特点。卷积操作能够在输出数据中大致保持输入数据的结构信息2.在卷积神经网络中,如何计算各层的感受野大小?答:3.卷积层的输出尺寸、参数量和计算量答:输出尺寸第二节.卷积的变种1.简述分组卷积及其应用场景答:分组卷积就是将输入通道和输出通道都划分为同样的组数,然后仅让处于相同组号的输入通道和输出通道相互进行全连接。只要是为了减少计算量。2.简述转置卷积的主要思想以原创 2020-07-06 21:21:53 · 228 阅读 · 0 评论 -
机器学习算法工程师导航
原创 2019-11-10 11:42:38 · 171 阅读 · 0 评论 -
《百面》-1.特征工程
目录1.特征归一化问题:为什么需要对数值类型的特征做归一化?方法1,线性函数归一化:方法2,零均值归一化:优点,随机梯度下降中权重的更新速度变快缺点:不适用于决策树2.类别型特质问题:在对数据进行预处理时,应该怎样处理类别性特征?方法1,序号编码:方法2,独热编码:方法3,二进制编码:3.高维组合特征的处理问题:什么是组合特征?如何处理高维组合特...原创 2019-11-10 19:10:55 · 790 阅读 · 0 评论 -
《百面》-7.优化算法
1.有监督学习的损失函数问题1:有监督学习涉及的损失函数有哪些?请列举并简述他们的特点。答:1.二分类问题,Y={1,-1}(1)0-1损失,非凸,非光滑,算法很难优化,,当P为真时取值为1,否则为0.(2)Hinge,凸上界,在fy=1出不可导,(3)Logistic,凸上界,处处光滑,可以使用梯度下降,因为对所有样本点都有所惩罚,所以对异常点更敏感(4)Cr...原创 2019-11-26 21:07:06 · 295 阅读 · 0 评论 -
《百面》-2.模型评估
目录1.评估指标的局限性问题1.准确率的局限性。问题2.精确率与召回率的权衡。问题3.平方根误差的“意外”2.ROC曲线1.问题:什么是ROC曲线?2.问题:如何绘制ROC曲线?3.问题:如何计算AUC?4.问题:ROC曲线相比P-R曲线有什么特点?3.余弦距离的应用1.问题:为什么在一些场景中使用余弦相似度而不是欧氏距离?2.问题:余弦距离是...原创 2019-11-10 21:24:44 · 689 阅读 · 0 评论 -
《百面》-5.非监督学习
1.K均值聚类问题1:简述K均值算法的具体步骤?答:(1)数据预处理,如归一化、离群点处理(2)随机选取K个簇中心,记为u1,u2.。。。。uk(3)定义代价函数:(4)令t=0,1,2.。。。为迭代步数。重复下面的过程指导J收敛对于每个样本x,将其分配到最近的簇。对于每一个类簇,重新计算该类簇的中心。问题2:K均值算法的优缺点是什么?如何对其进行调优?答:...原创 2019-11-25 19:32:33 · 141 阅读 · 1 评论 -
《百面》-4.降维
3.线性判别分析问题1:对于具有类别标签的数据,应当如何设计目标函数使得降维的过程中不损失类别信息?在这种目标下,应当如何进行求解?答:LDA首先是为了分类服务的,所以需要找到一个投影w,使得投影后的样本尽可能按照原始类别分开。假设有C1,C2两个样本,均值分别为u1,u2.我们希望投影后两个类之间的距离最大。所以最优化问题为。当w方向与(u1-u2)一致的时候,距离最大。...原创 2019-11-21 21:03:27 · 191 阅读 · 0 评论 -
《百面》-4.降维(PCA专场)-2
1.PCA最小平方误差理论问题1:PCA求解的其实是最佳投影方向,既一条直线,这与数学中线性回归问题的目标不谋而合,能否从回归的角度定义PCA的目标并相应的求解问题呢?答:我们还是从二维空间考虑,上一节求解得到一条直线使得样本点投影到该直线上方差最大,从求解直线的思路出发,很容易联想到线性回归,那么从线性回归出发,去定义PCA的目标,就是在高维空间中,找到一个d维的超平面,使得数据点到这个...原创 2019-11-16 21:48:53 · 119 阅读 · 0 评论 -
《百面》-4.降维(PCA专场)
1.PCA最大方差理论问题1.如何定义主成分?从这种定义出发,如何设计目标函数使得降维达到提取主成分的目的?针对这个目标函数,如何对PCA问题进行求解?答: PCA旨在找到数据中的主成分,并利用这些主成分表征原始数据,从来达到来降维的目的。方差:方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差...原创 2019-11-15 11:11:43 · 250 阅读 · 0 评论 -
《百面》-3.经典算法
目录1.支持向量机问题1.在空间上线性可分的两类点,分别向SVM分类的超平面做投影,这些点在超平面上的投影仍是线性可分么?问题2.是否存在一组参数使SVM训练误差为0?问题3.训练误差为0的SVM分类器一定存在么?问题4.加入松弛变量的SVN训练误差可以为0么?2.逻辑回归问题 1.逻辑回归相比于线性回归,有何异同?问题2.当使用逻辑回归处理多标签的分类问题时...原创 2019-11-13 20:31:51 · 708 阅读 · 0 评论 -
《百面》-10.循环神经网络
1.循环神经网络和卷积神经网络问题1:处理文本数据时,循环神经网络与前馈神经网络相比有什么特点?答:nett=Uxt+Wht−1,hf=f(nett),y=g(VhT)net_t=Ux_t+Wh_{t-1},h_f=f(net_t),y=g(Vh_T)nett=Uxt+Wht−1,hf=f(nett),y=g(VhT)f,g为激活函数,U为输入层到隐含层的权重矩阵,W为隐含...原创 2019-12-15 15:55:07 · 156 阅读 · 0 评论 -
《百面》-9.前向神经网络
5.深度卷积神经网络问题1:卷积操作的本质特性包括稀疏交互和参数共享,具体解释这两种特性及其作用。答:在卷积神经网络中,卷积核尺度远小于输入的维度,这样每个输出神经元仅与前一层特定局部区域内的神经元存在连接权重,我们称这种特性为稀疏交互。稀疏交互的物体意义是,通常图像、文本、语音等现实世界中的数据都具有局部的特征结构,我们可以先学习局部特征,再将局部的特征组合起来形成更复杂的和抽象的特征。...原创 2019-12-15 13:41:05 · 275 阅读 · 0 评论 -
《百面》-9.前向神经网络
1.多层感知机与布尔函数问题1:多层感知机表示异或逻辑时最少需要几个隐含层(仅考虑二元输入)?答:一层问题2:如果只是用一个隐层,需要多少隐节点能够实现包含n元输入的任意布尔函数?答:问题3:考虑多隐层的情况,实现包含n元输入的任意布尔函数最少需要多少个网络节点和网络层?答:2.深度神经网络中的激活函数问题1:写出常用激活函数及其导数?答:(1)sigmoi...原创 2019-12-15 12:34:30 · 604 阅读 · 0 评论