创新工厂地狱５０题

最新推荐文章于 2020-03-03 22:56:51 发布

虎妞C

最新推荐文章于 2020-03-03 22:56:51 发布

阅读量745

点赞数 1

分类专栏：机器学习文章标签：算法机器学习

本文链接：https://blog.csdn.net/shanyicheng1111/article/details/79755621

版权

机器学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

创新工厂在组建一个人工智能的社区，据说完成３道并且通过专家评审，即可获得新社区邀请资格。专家有李开复，Hinton...

以下是我的回答和50道问题。

有时间的话一定要把这50道题答一遍，这是一个精选笔试面试集合：）

我的回答：

7. 深度神经网络（deep neural network）具体工作原理是怎样的？

深度神经网络是多重非线性变换构成的多个处理层对数据进行高层抽象的算法，或者说是通过复合多层次线性空间的偏线性特征，找到与对象体属性匹配的特征表征。具体是将原始特征通过多个隐藏层组合成为新的表征，然后去匹配目标函数，并通过反向传播算法，不断优化隐藏层系数，使得权重W和补丁bias刚好构成某个抽象的“偏线性”特征。深度神经网络优于普通的机器学习模型在于它是一种张量模型，即多层“隐藏层”和激活函数构成了“高阶特征组合”。

8.CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？主要用途分别是什么？

CNN的内部结构主要有三个特性 localization , sharing , pooling. 也就是它是一种基于局部特征的表征，前期保留了位置信息。并且pooling一定程度上有抗噪声和旋转干扰的能力。主要用于视觉方面图像有关的任务。
RNN主要是进行时序建模。即当前的输出不仅取决与现在的输入还跟之前之后的输入有关系。RNN内部网络是每一层不仅输出下一层的输入特征还输出隐含状态。隐藏层的更新建模了输入特征的时间依赖关系。RNN主要用于时间序列有关的任务，比如机器翻译，视频字幕生成,时序预测。
DNN是通过隐藏层和激活函数来生成高阶的信息，即原始特征的某种高阶组合来拟合目标的某种特征概念。主要用于自动产生高阶信息作为人工特征的补充。

39.用于数据挖掘的聚类算法有哪些，各有何优势？

常用的聚类算法有
1．基于分层方法，就是把给定数据集进行逐层分解（自底向上和自顶向下），直到满足某种条件。自底向上的方法，开始时每个数据都是一个组，然后通过一定的距离度量把接近的合并。优点是适用于大规模数据，比如T量级，而且不用事先指定聚类个数。

2．基于划分的聚类。将构造K个分组，每个分组代表一个聚类，这里每个分组至少包含一个数据点，每个数据点属于且仅属于一个分组。对于给定的K值，算法先给出一个初始的分组方法，然后通过反复迭代的方法改变分组，使得每一次改进之后的分组方案较前一次好，这里好的标准在于同一组中的点越近越好，不同组中的点越远越好。代表算法有：K-means，K-medoids。优点是时间和空间复杂度低。

3. 基于密度的聚类（density-based methods）：其核心思想在于只要一个区域中点的密度大于某个阈值，就把它加到与之相近的聚类中去。基于密度的方法的特点是不依赖于距离，而是依赖于密度，从而克服基于距离的算法只能发现“球形”聚簇的缺点。

4.谱聚类（Spectral Clustering）先将数据转换成邻接矩阵再得出拉普拉斯矩阵，再对拉普拉斯矩阵进行特征分解，把特征向量用于Kmeans聚类。优点是有降维作用，空间复杂度低。

原问题：

1. 神经网络可以用来做任务预测。那么在任务系统中，神经网络能表示出它还需要做的任务吗？（比如打车，需要三个信息(A,B,C)。它已经得到了一个信息A，怎么让系统能走接下的几步,获得得必要的信息呢？）

2.姿态估计（pose estimation）的主流方法有哪些？优点和缺点分别是？

3. Keras，Theano，pytorch，caffe2 哪种框架更好一些，应该怎么尝试学习？

4. 如何调用caffe已经训练好的net？

5. 在所有参数都相同的情况下，同一个模型用theano，tf，pytorch实现，performance差距较大的原因有哪些？

6.神经网络可以实现连续型变量的回归预测吗？如果可以，怎么做？

7. 深度神经网络（deep neural network）具体工作原理是怎样的？

8.CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？主要用途分别是什么？

9. cnn是如何解决人脸或人体关键点回归问题的？

10. 如何评价rcnn、fast-rcnn和faster-rcnn这一系列方法？

11. 目标检测SSD相对于YOLO与faster-RCNN做了哪些改进？效果怎样？