- 博客(6)
- 收藏
- 关注
原创 机器学习基础问题汇总
数据预处理特征选择的方法;模型评估方法过拟合的解决方法;如何用尽可能少的样本训练模型同时又保证模型的性能;优化算法:梯度下降的优缺点;L1与L2的区别以及如何解决L1求导困难;算法原理几种模型(svm,lr,gbdt,em)的原理以及公式推导;rf与gbdt的区别?gbdt与xgboost的区别?决策树处理连续值的方法?kmeans的原理,优缺点以及改进;常...
2019-08-20 10:16:23 1546 1
原创 决策树问题汇总
文章目录1. 决策树如何剪枝?ID3、C4.5和CART三种决策树的区别?1. 决策树如何剪枝?(1)前剪枝( Pre-Pruning)前剪枝原则有:a.节点达到完全纯度;b.树的深度达到用户所要的深度;c.节点中样本个数少于用户指定个数;d.不纯度指标下降的最大幅度小于用户指定的幅度。(2) 后剪枝( Post-Pruning)首先构造完整的决策树,允许决策树过度拟...
2019-08-20 10:14:57 6073
原创 Hive基本语句及函数用法汇总
文章目录1. Hive的基本概念2. Hive基础sql语法2.1 DDL 操作2.2 DML操作:元数据存储2.3 DQL操作:数据查询SQL2.4 从SQL到HiveQL应转变的习惯3. Hive基本函数汇总3.1 常用数据类型3.2 语法关键字3.3 hive常用函数整理1. Hive的基本概念1.1 hive是什么?Hive是基于Hadoop的数据仓库工具,相当于hadoop之上的...
2019-08-20 10:13:59 9009
原创 集成学习问题汇总
文章目录1. 集成学习的结合策略有哪些?2. Bagging和Boosting两者之间的区别3. AdaBoost和GBDT的区别1. 集成学习的结合策略有哪些?(1)平均法: 用于数值类的回归预测问题算术平均:H(x)=1T∑1Thi(x)H(x) = \frac {1} {T} \sum\limits_{1}^{T}h_i(x)H(x)=T11∑Thi(x)如果每个个体学习器有...
2019-08-20 10:04:57 1530
原创 逻辑回归问题汇总
文章目录1. Logistic回归与线性回归的区别与联系?2. Logistic回归有哪些基本假设?3. Logistic回归的损失函数?4. Logistic回归损失函数的求解方法?5. Logistic回归是如何进行分类的?6. Logistic回归为什么要用极大似然函数作为损失函数?7. 为什么在Logistic回归训练的过程中要将高度相关的特征去掉?8. Logistic回归有哪些优缺点?...
2019-08-05 11:54:59 6869
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人