笔记
文章平均质量分 91
风吹且头凉37
xupt大数据与人工智能实验室机器学习组成员
展开
-
决策树学习内容整理
在机器学习算法中,决策树无疑是十分经典的算法,由于其具有良好的解释性而被被大家利用。作为一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。在本文将重点介绍分类树的相关内容常用的决策树算法有ID3、C4.5和CART算法,分别对应的划分依据为信息熵、信息增益率和基尼系数。一、关于ID3的总结ID3算法是典型的建立在奥卡姆剃刀原理上的算法,故越是小型的决策树越优于大的决策树(奥卡姆剃刀原理:在科学研究任务中,应该优先使用较为简单的公式或者原理,而不是复杂的原创 2021-09-12 16:36:19 · 453 阅读 · 0 评论 -
蒟蒻的大一暑期机器学习重点问题整理
1.1. 当数据有缺失值的时候, 你认为处理缺失值比较合理的方法(缺失值举例:泰坦尼克号幸存者数据中 有年龄 性别 职业 是否存活 四个特征 但某些样本的职业特征为空)。回答:在有缺失值的样本数量相对于总体较小时,可以选择删除样本,如果缺失样本较多,我们则可以使用所缺失特征的中位数众数和均值极值等对缺失值进行填补,或将缺失的特征label也视为一种特征,再使用回归决策树进行预测获得缺失特征2. 请简述随机梯度下降,批梯度下降的区别和各自的优点回答:随机梯度下降是对单个样本的loss值进行计原创 2021-09-11 17:00:23 · 372 阅读 · 0 评论