2401_87114817-CSDN博客

原创机器学习课堂笔记

（3）原因：训练数据太少（比如只有几百组），模型的复杂度太高（比如隐藏层层数设置的过多，神经元的数量设置的过大），数据不纯。在模型训练完成后，测试集用来检验模型对新数据的泛化能力，即模型处理它之前未见过的数据的能力。（1）小规模样本集（几万量级），常用的划分比例：训练集：验证集：测试集=6：2：2 ，训练集：测试集==8：2、7：3。注：超参数越少，或者超参数很容易调整，那么可以减少验证集的比例，更多的分配给训练集。在这种情况下，没有预先定义的输出标签，算法需要自己发现数据中的模式和结构。

2024-09-14 12:42:29 1048

原创机器学习知识梳理

统计学习理论强调从数据中学习，通过估计数据的概率分布来构建预测模型，实现知识发现。EM算法通过迭代更新隐变量的期望，最大化观测数据的似然函数，常用于处理含有隐变量的概率模型。

2024-09-07 19:13:46 570 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 机器学习课堂笔记

原创 机器学习知识梳理

空空如也

空空如也

原创机器学习课堂笔记

原创机器学习知识梳理