rapidocr介绍
A cross platform OCR Library based on OnnxRuntime.
以下资料是根据RapidOCR获得2024中国互联网发展创新与投资大赛(开源)二等奖整理汇编的
支持识别的文种如下:
中、英、日、韩、中文繁体、泰卢固文、卡纳达文、泰米尔文、拉丁文、 阿拉伯字母 、斯拉夫字母、梵文
部分文种的使用国家或地区:
- 泰卢固文(Telugu):主要在印度的安得拉邦和特伦甘纳邦使用。
- 卡纳达文(Kannada):主要在印度的卡纳塔克邦使用。
- 泰米尔文(Tamil):主要在印度的泰米尔纳德邦、斯里兰卡的东北部、新加坡、马来西亚以及全球泰米尔社区使用。
- 拉丁文:作为古罗马帝国的官方语言,拉丁文对许多现代欧洲语言有深远影响。现代使用拉丁文的国家或地区不多,但拉丁文在学术、法律和宗教领域仍有使用。
- 阿拉伯字母:阿拉伯字母是阿拉伯语的书写系统,广泛用于中东和北非地区,包括沙特阿拉伯、埃及、伊拉克、叙利亚、约旦、黎巴嫩、阿尔及利亚、摩洛哥等国家。
- 斯拉夫字母:斯拉夫字母有两种主要变体,西里尔字母和格拉哥里字母。西里尔字母主要在俄罗斯、乌克兰、白俄罗斯、保加利亚、塞尔维亚、马其顿等国家使用。格拉哥里字母主要用于一些东正教教堂的宗教文本中。
- 梵文:梵文是古印度的一种古典语言,主要