自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK3

在训练过程中,多次轮流使用不同的组合作为训练集和验证集,例如第一次将数据的前 1/3 作为验证集,中间 1/3 和后 1/3 作为训练集;最后在训练集和验证集上整体进行训练,在私人测试集上进行测试,这样可以得到比较客观的评价结果,避免模型过拟合于特定的训练集和验证集划分方式,更好地评估模型在不同数据子集上的性能和泛化能力。- 产生原因:模型的灵活性过强,以至于根据训练集拟合出了过于复杂的函数,对训练集的细节过度学习,导致在测试集上的输出与真实值偏差很大。- 定义:指数据的分布不同。

2024-09-03 10:14:47 388

原创 Datawhale X李宏毅苹果树 AI夏令营 TASK2

过拟合现象:复杂模型(高次模型)虽然具有更强大的表达能力,但在训练数据上误差非常小,而在测试数据上误差却很大,这就是过拟合。原因是高次模型中符合当前训练数据规律的函数可能不止一条,但真正符合实际数据规律的曲线只有一条(毕竟训练数据是实际数据的子集)。- 如果 值太小,参数更新步长过小,收敛的速度会非常慢,需要更多的迭代次数才能达到较好的效果。- 如果 值过大,可能导致参数更新步长过大,直接使损失函数发散,无法收敛到最优解。·模型评估(定义损失函数) -常用的损失函数是均方误差(MSE)

2024-08-30 12:54:05 392

原创 【无标题】Datawhale X李宏毅苹果树 AI夏令营 TASK1

模型选择:不同的自然语言处理任务需要选择不同的模型,如循环神经网络(RNN)和长短时记忆网络(LSTM)在处理序列数据(如文本)方面具有优势。2. 与传统编程的区别:传统编程是人类根据已知的规则和逻辑编写代码来解决问题,而机器学习是让计算机从数据中自动学习规则和模式来解决问题。- 数据预处理:自然语言处理中的数据预处理包括分词、去除停用词、词干提取等步骤,这些步骤可以提高数据的质量和模型的性能。- 模型架构:不同的图像识别任务可能需要不同的模型架构,如卷积神经网络(CNN)在图像识别中表现出色。

2024-08-26 10:13:31 271

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除