小马199-CSDN博客

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK3

在训练过程中，多次轮流使用不同的组合作为训练集和验证集，例如第一次将数据的前 1/3 作为验证集，中间 1/3 和后 1/3 作为训练集；最后在训练集和验证集上整体进行训练，在私人测试集上进行测试，这样可以得到比较客观的评价结果，避免模型过拟合于特定的训练集和验证集划分方式，更好地评估模型在不同数据子集上的性能和泛化能力。- 产生原因：模型的灵活性过强，以至于根据训练集拟合出了过于复杂的函数，对训练集的细节过度学习，导致在测试集上的输出与真实值偏差很大。- 定义：指数据的分布不同。

2024-09-03 10:14:47 388

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK2

过拟合现象：复杂模型（高次模型）虽然具有更强大的表达能力，但在训练数据上误差非常小，而在测试数据上误差却很大，这就是过拟合。原因是高次模型中符合当前训练数据规律的函数可能不止一条，但真正符合实际数据规律的曲线只有一条（毕竟训练数据是实际数据的子集）。- 如果值太小，参数更新步长过小，收敛的速度会非常慢，需要更多的迭代次数才能达到较好的效果。- 如果值过大，可能导致参数更新步长过大，直接使损失函数发散，无法收敛到最优解。·模型评估（定义损失函数） -常用的损失函数是均方误差（MSE）

2024-08-30 12:54:05 392

原创【无标题】Datawhale X李宏毅苹果树 AI夏令营 TASK1

模型选择：不同的自然语言处理任务需要选择不同的模型，如循环神经网络（RNN）和长短时记忆网络（LSTM）在处理序列数据（如文本）方面具有优势。2. 与传统编程的区别：传统编程是人类根据已知的规则和逻辑编写代码来解决问题，而机器学习是让计算机从数据中自动学习规则和模式来解决问题。- 数据预处理：自然语言处理中的数据预处理包括分词、去除停用词、词干提取等步骤，这些步骤可以提高数据的质量和模型的性能。- 模型架构：不同的图像识别任务可能需要不同的模型架构，如卷积神经网络（CNN）在图像识别中表现出色。

2024-08-26 10:13:31 271

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK3

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK2

原创 【无标题】Datawhale X李宏毅苹果树 AI夏令营 TASK1

空空如也

空空如也

原创【无标题】Datawhale X李宏毅苹果树 AI夏令营 TASK1