微软Florence-2模型load_dataset函数加载本地json文件数据集报错

这里写自定义目录标题

报错信息

在微调微软的Florence-2模型的时候加载本地数据集报错。

解决方案

如果你的数据集是分开的,也就是训练集和验证集是两个json文件,就如下所示,如果不是,请往下翻,有不分开的加载介绍。
可以看到
可以看到他的源码种是传入了一个字符串(“train”,另一个又通过“validation”来映射)来进行映射,所以你的data加载的时候需要用map来构造映射,如下所示:
在这里插入图片描述
以上这种方法,是train数据和validation数据分开的时候的写法,也就是根据这两个字符串去映射各自的文件(记住必须是这两个字符串,不支持自定义,因为他在源码中写死了,train这个字符串只能索引train的数据集文件)。
下面说一下如果你的数据集不是分开的而是在一个json里面该怎么做。
首先你的数据集格式得是这样:
在这里插入图片描述
每个字符串后面是一个字典列表也就是你真正得数据集,必须是这三个字符串,他写死了,就是找这三个字符串来分割数据。然后在loaddataset这里,也不需要map,毕竟就一个文件,直接给路径就行了。如下所示。
在这里插入图片描述

相关原理

map键值对映射

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

范sr

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值