CTW数据集的classification的benchmark的个人解读

木漏れ日の中で

于 2024-02-04 21:17:43 发布

阅读量523

点赞数 6

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/minglu1999/article/details/136000135

版权

本文介绍了关于CTW-BaseLineData项目中的图像分类任务，涉及数据集特点（仅包含前1000个高频汉字），数据集划分（train,val,test），以及本地和服务器测试的详细步骤。教程和测试文件的要求也做了说明。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于classification图像分类这个任务，提几个重点
首先克隆git项目https://github.com/yuantailing/ctw-baseline
data目录下的东西需要从https://ctwdataset.github.io/下载

首先要注意的是，分类任务的对象只是前1000个频度最高的汉字，其余的汉字不作为分类任务的对象。

其次，数据集被分成train, val和test三部分，图像分类的话只有train和val的标注是完全公开的，如果要基于test进行测试，只能提交至指定的测试服务器。本地的测试默认的是用val这部分进行测试。

要进行本地测试，首先需要意的是把annotaions里的4个文件放在./data/annotations/downloads里，然后在./judge
目录下运行fake_testing_set.py，然后在./data/annotations/会生成ground truth文件。
如果是在服务器进行test部分的测试，./judge应该是用不到的。

关于tutorials/2-classification.ipynb，需要注意的是教程里的默认的数据集划分方式是把train和val放一起作为训练集。test部分的测试需要在测试服务器，而要提交的是一个jsonl文件由classification/eval.py得到。测试这块，如果是在云端，需要的东西的准备其实运行这一个文件的运行应该就够了。本地的话，还是详见./judge吧。

木漏れ日の中で

博客等级

码龄14年

12
原创

51
点赞

43
收藏

41
粉丝

关注

私信

热门文章

分类专栏

bug fixing 1篇

最新评论

记录一次自己使用OneDrive差点导致数据丢失的经历（个人之见，谨慎参考）
好446: 你是给吓坏了，我是给气坏了，一开始我只是觉得多一个备份没什么不好，一旦他空间满之后，复制都复制不了，我都感觉电脑都不是我的，你还要去官网去清理文件，他那个官网又打不开，为什么要去官网，因为他说你不清理的话三个月之后就清空掉，自己的东西还是在手里比较好，有什么重要的自己搞个u盘，不遭罪
记录一次自己使用OneDrive差点导致数据丢失的经历（个人之见，谨慎参考）
阿里茫茫: 不知这么搞得（曾经改变过onedrive文件夹），电脑里有了两个onedrive文件夹，还都显示云图标！内容还不完全一样。前天忍不了了，尝试把它们合并。结果，今天发现，有的子文件夹直接没了！不知道有多少文件丢了！现在，折腾半天都搞不清当前onedrive顶层文件夹，也找不到更新的log！开了梯子在线上也还没找到！
记录一次自己使用OneDrive差点导致数据丢失的经历（个人之见，谨慎参考）
阿里茫茫: 不知这么搞得（曾经改变过onedrive文件夹），电脑里有了两个onedrive文件夹，还都显示云图标！内容还不完全一样。前天忍不了了，尝试把它们合并。结果，今天发现，有的子文件夹直接没了！不知道有多少文件丢了！现在，折腾半天都搞不清当前onedrive顶层文件夹，也找不到更新的log！开了梯子在线上也还没找到！
记录一次自己使用OneDrive差点导致数据丢失的经历（个人之见，谨慎参考）
寒山独见君~: 可以做个本地文件夹到onedrive中文件夹映射的
CTW数据集的classification的benchmark的个人解读
CSDN-Ada助手: 恭喜你写了这篇关于CTW数据集分类benchmark的个人解读，看来你对这个领域有很深的理解。希望你能继续保持创作的热情，分享更多关于数据集分类benchmark的见解和经验。或许下一步你可以尝试写一些实际案例分析，或者和其他领域的专家进行交流，以便更全面地了解这一话题。期待你更多的精彩内容！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。