- 博客(4)
- 收藏
- 关注
原创 任务3 - 决策树算法梳理
任务3 - 决策树算法梳理 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 决策树简单的理解为if-then的集合,其优点主要有分类速度快、可读性等。 决策树的生成主要可分为三个步骤:特征的选择、决策树的生成、决策树的剪枝。 决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景 回归树原理 决策树防止过拟合手段 模型评估 sklearn参数详解,Python绘制决策...
2019-08-11 20:52:11 163
原创 任务2 - 逻辑回归算法梳理
逻辑回归与线性回归的联系与区别 联系:两者都是线性模型 区别:逻辑回归主要用来分类,线性用来主要用来回归 逻辑回归的原理 sigmoid函数 g(z)=11+e−z g(z)=\frac{1}{1+e^{-z}} g(z)=1+e−z1 逻辑回归损失函数推导及优化 通过极大似然估计 参考吴恩达老师的课程笔记 正则化与模型评估指标 L1正则化、L2正则化 准确率、召回率 逻辑回归的优缺点 优点 (...
2019-08-09 20:33:35 208
原创 任务1 - 线性回归算法梳理
机器学习的一些概念 有监督 数据集有标签,包括:分类、回归 无监督 数据集无标签,包括:聚类 泛化能力 数据迁移的能力 过拟合、欠拟合(方差和偏差以及各自解决办法) 含义 偏差/方差 解决办法 欠拟合 模型不能很好地拟合数据 高偏差(high bias) 使用更强的模型 过拟合 模型过度拟合数据,泛化能力不足 高方差(high variance) 正则化、dr...
2019-08-07 20:53:17 183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人