自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 机器学习基础问题汇总

数据预处理特征选择的方法;模型评估方法过拟合的解决方法;如何用尽可能少的样本训练模型同时又保证模型的性能;优化算法:梯度下降的优缺点;L1与L2的区别以及如何解决L1求导困难;算法原理几种模型(svm,lr,gbdt,em)的原理以及公式推导;rf与gbdt的区别?gbdt与xgboost的区别?决策树处理连续值的方法?kmeans的原理,优缺点以及改进;常...

2019-08-20 10:16:23 1546 1

原创 决策树问题汇总

文章目录1. 决策树如何剪枝?ID3、C4.5和CART三种决策树的区别?1. 决策树如何剪枝?(1)前剪枝( Pre-Pruning)前剪枝原则有:a.节点达到完全纯度;b.树的深度达到用户所要的深度;c.节点中样本个数少于用户指定个数;d.不纯度指标下降的最大幅度小于用户指定的幅度。(2) 后剪枝( Post-Pruning)首先构造完整的决策树,允许决策树过度拟...

2019-08-20 10:14:57 6073

原创 Hive基本语句及函数用法汇总

文章目录1. Hive的基本概念2. Hive基础sql语法2.1 DDL 操作2.2 DML操作:元数据存储2.3 DQL操作:数据查询SQL2.4 从SQL到HiveQL应转变的习惯3. Hive基本函数汇总3.1 常用数据类型3.2 语法关键字3.3 hive常用函数整理1. Hive的基本概念1.1 hive是什么?Hive是基于Hadoop的数据仓库工具,相当于hadoop之上的...

2019-08-20 10:13:59 9009

原创 集成学习问题汇总

文章目录1. 集成学习的结合策略有哪些?2. Bagging和Boosting两者之间的区别3. AdaBoost和GBDT的区别1. 集成学习的结合策略有哪些?(1)平均法: 用于数值类的回归预测问题算术平均:H(x)=1T∑1Thi(x)H(x) = \frac {1} {T} \sum\limits_{1}^{T}h_i(x)H(x)=T1​1∑T​hi​(x)如果每个个体学习器有...

2019-08-20 10:04:57 1530

原创 逻辑回归问题汇总

文章目录1. Logistic回归与线性回归的区别与联系?2. Logistic回归有哪些基本假设?3. Logistic回归的损失函数?4. Logistic回归损失函数的求解方法?5. Logistic回归是如何进行分类的?6. Logistic回归为什么要用极大似然函数作为损失函数?7. 为什么在Logistic回归训练的过程中要将高度相关的特征去掉?8. Logistic回归有哪些优缺点?...

2019-08-05 11:54:59 6869

原创 SVM算法问题汇总

文章目录1. svm为什么要引入拉格朗日的优化方法?1. svm为什么要引入拉格朗日的优化方法?

2019-08-05 11:54:41 1266

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除