- 博客(1)
- 收藏
- 关注
原创 Datawhale夏令营学习笔记二
首先是数据读取部分,用pandas的read_csv函数将训练数据和测试数据分别读入。标签也就是需要我们最后预测的部分,在这里是数据集的后34列。然后将训练数据划分成数据集和验证集,需要注意的是这里的验证集才是供模型验证准确后继续优化的数据部分,而上面的训练集则只在模型训练好后用来衡量模型的准确性,只用一次且模型不能根据此次结果来继续优化,这一点需要注意。举一个例子就是训练集就像平时学习时的作业,验证集像是期中期末,可以多次使用,测试集是高考,只能考一次。
2023-07-27 19:46:09
71
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人