自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 Datawhale夏令营学习笔记二

首先是数据读取部分,用pandas的read_csv函数将训练数据和测试数据分别读入。标签也就是需要我们最后预测的部分,在这里是数据集的后34列。然后将训练数据划分成数据集和验证集,需要注意的是这里的验证集才是供模型验证准确后继续优化的数据部分,而上面的训练集则只在模型训练好后用来衡量模型的准确性,只用一次且模型不能根据此次结果来继续优化,这一点需要注意。举一个例子就是训练集就像平时学习时的作业,验证集像是期中期末,可以多次使用,测试集是高考,只能考一次。

2023-07-27 19:46:09 71 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除