- 博客(2)
- 收藏
- 关注
原创 机器学习课堂笔记
(3)原因: 训练数据太少(比如只有几百组), 模型的复杂度太高(比如隐藏层层数设置的过多,神 经元的数量设置的过大) ,数据不纯。在模型训练完成后,测试集用来检验模型对新数据的泛化能力,即模型处理它之前未见过的数据的能力。(1)小规模样本集(几万量级),常用的划分比例: 训练集:验证集:测试集=6:2:2 ,训练集:测试集==8:2、7:3。注:超参数越少,或者超参数很容易调整,那么可以减少验证集的比例,更多的分配给训练集。在这种情况下,没有预先定义的输出标签,算法需要自己发现数据中的模式和结构。
2024-09-14 12:42:29 1048
原创 机器学习知识梳理
统计学习理论强调从数据中学习,通过估计数据的概率分布 来构建预测模型,实现知识发现。EM算法通过迭代更新隐变量的期望,最大化观测数据的似然函数,常用于处理含 有隐变量的概率模型。
2024-09-07 19:13:46 570 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人