该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
1、深度学习框架TensorFlow中有哪四种常用交叉熵?
答: tf.nn.weighted_cross_entropy_with_logits
tf.nn.sigmoid_cross_entropy_with_logits
tf.nn.softmax_cross_entropy_with_logits
tf.nn.sparse_softmax_cross_entropy_with_logits
2、什么叫过拟合,避免过拟合都有哪些措施?
答:过拟合:就是在机器学习中,我么测试模型的时候,提高了在训练数据集的表现力时候,
但是在训练集上的表现力反而下降了。
解决方案:
1.正则化 ;
2.在训练模型过程中,调节参数。学习率不要太大;
3.对数据进行交叉验证;
4.选择适合训练集合测试集数据的百分比,选取合适的停止训练标准,使对机器的训练在合适;
5.在神经网络模型中,我们可以减小权重;
3、什么是核函数?
核函数是将线性不可分的特征隐射到高位特征空间,从而让支持向量机在这个高维空间线性可分,也就是使用核函数可以向高维空间映射并解决非线性的分类问题。包括线性核函数,多项式核函数,高斯核函数等,其中高斯核函数最为常用。
4、深度学习框架TensorFlow中常见的核函数都有哪些?
SVM高斯核函数,应为如果想要分割非线性数据集,改变线性分类器隐射到数据集,就要改变SVM损失函数中的核函数
线性核函数
多项式核函数
5、朴素贝叶斯方法的优势是什么?
朴素贝叶斯有稳定的分类效率
对于小规模的数据表现很好,能处理多分类问题,可以再数据超出内存时,去增量训练
对缺失数据不太敏感,算法比较简单,常用于文本分类。
6、什么是监督学习的标准方法?
所有的回归算法和分类算法都属于监督学习并且明确的给给出初始值在训练集中有特征和标签,并且通过训练获得一个模型,在面对只有特征而没有标签的数据时,能进行预测。
7、在机器学习中,模型的选择是指什么?
根据一组不同复杂度的模型表现,从某个模型中挑选最好的模型。选择一个最好模型后,在新的数据上来评价其预测误差等评价和指标。
8、图形数据库Neo4J的优劣势?
优势:1.更快的数据库操作,前提是数据量足够大。
2. 数据更加直观,相应的SQL语句更加好写。
3.更灵活,不管有什么新的数据需要储存,都是一律的节点,只需要考虑节点属性和边属性。
4.数据库的操作不会随着数据库的增大有明显的降低。
劣势:1.极慢的插入速度。
2.超大的节点。当一个节点的边非常多,
有关这个节点的操作速度就会大大下降
9、LR和SVM的联系与区别是什么?
都是分类算法
如果不考虑核函数,LR和SVM都是线性分类算法,也就是说他们的分类决策面都是线性的。
LR和SVM都是监督学习算法
LR和SVM的损失函数不同
SVM只考虑局部的边界线附近的点 ,LR考虑全局,远离的点对边界线的确定也起作用。