Total-Text-Dataset 项目推荐
1. 项目基础介绍和主要编程语言
Total-Text-Dataset 是一个开源的文本检测数据集项目,由 GitHub 用户 cs-chan 维护。该项目主要用于场景文本检测和识别的研究,提供了丰富的图像数据和标注信息。项目的主要编程语言是 Python,适合用于机器学习和计算机视觉领域的研究人员和开发者使用。
2. 项目核心功能
Total-Text-Dataset 的核心功能包括:
- 多方向文本数据集:提供了 1555 张图像,包含三种不同的文本方向:水平、多方向和弯曲文本。
- 高质量标注:每张图像都经过精细标注,包括文本位置和内容,适用于各种文本检测和识别算法的训练和评估。
- 开源社区支持:项目在 GitHub 上开源,支持社区贡献和反馈,不断更新和改进。
3. 项目最近更新的功能
最近更新的功能包括:
- 2022年4月6日更新:检测排行榜更新,增加了 FCE、ABPNet、PCR、CentripetalText 和 HierText 等方法的评估结果。
- 2020年4月29日更新:检测排行榜更新,特别强调了端到端(E2E)方法的性能。
- 2019年9月8日更新:新的训练集标注信息发布,提供了更详细的标注数据。
- 2019年9月7日更新:更新了场景文本图像标注的引导工具箱,提升了标注效率和准确性。
Total-Text-Dataset 项目为文本检测和识别领域的研究提供了宝贵的数据资源和工具支持,是相关研究人员和开发者不可或缺的资源。