制作自己的数据集

入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

虽然现在有很多可以现用的数据集,比如说coco,MINIST等,但有些时候需求不一样,还是没法偷懒,要自己制作数据集。


首先呢当然是先自己去找对应的图片啦

接下来我们需要简单的工具来对图像进行标注,这里推荐labelImg

我们可以在Anaconda Prompt输入命令

pip install labelImg

等待下载完毕后再接着输入命令

labelImg

就可以开始用进行标注啦

(1)是打开相应的图片文件夹

(2)首先在这里设定好保存的路径地址,这样待会直接“save”就很方便

(3)这里一定!!!!要记得先设好形式!!!!

(4)创建标记框

(5)删除标记框


注:同时注意保存的文件夹的形式。

  • 4
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论
制作自己的数据集可以按照以下步骤进行: 1. 确定数据集的目的和主题:首先,明确你想要构建数据集的目的和主题,例如自然语言处理、计算机视觉等。 2. 收集和筛选数据:根据你的主题,在互联网上搜索相关的数据源,或者创建自己的数据。确保数据的质量和准确性,同时尽量涵盖不同的情况和变化。 3. 数据清洗和预处理:对收集到的数据进行清洗和预处理,以去除无效或冗余的数据,并将数据转换为适合模型训练的格式。这可能包括文本清洗、图像裁剪、标注等操作。 4. 标注和注释数据:根据你的需求,对数据进行标注和注释,以便训练模型能够理解和学习数据的含义。例如,对文本数据可以进行分类、命名实体识别等标注,对图像数据可以进行目标检测、分割等注释。 5. 划分训练集和测试集:将数据集划分为训练集和测试集,用于模型的训练和评估。通常,训练集用于模型的训练,测试集用于评估模型的性能。 6. 数据增强(可选):如果你的数据量有限,可以使用数据增强技术生成更多的训练样本。例如,对图像进行旋转、翻转、缩放等操作,对文本进行词语替换、重排等操作。 7. 数据集的格式:根据你使用的模型和框架要求,将数据集保存为特定的格式,如CSV、JSON、TFRecord等。 8. 数据集的文档和元数据:为了方便其他人使用你的数据集,你可以提供相关的文档和元数据,包括数据集的描述、格式说明、标注规范等。 9. 数据集的分享与发布:如果你希望与他人共享你的数据集,可以将其上传到数据集共享平台或者在论文、博客等中公开分享。 请注意,在制作自己的数据集时,需要遵守相关的法律法规和道德准则,尊重数据的隐私和版权。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

tt丫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值