tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题

最新推荐文章于 2024-03-21 22:37:35 发布

weixin_30895603

最新推荐文章于 2024-03-21 22:37:35 发布

阅读量1k

点赞数

文章标签： c# 人工智能

原文链接：http://www.cnblogs.com/zhishuai/p/7811855.html

版权

编译tesseract - ocr时各种不通过也很疑惑，完全按照官方指导来的啊

首先以为是vs的编码问题，随切换选项-切换Unicode或多编码字符集，但仍无效。

定位到乱码的文件，用notepad++ 打开，查看编码，是“”“以UTF-8无BOM格式编码”，切换成utf-8编码，将所有有中文的编码都切换了（还好只有两个），然后编译既然成功了。

然后新建了一个工程，一路默认创建。打开默认创建的cpp文件，是ANSI编码，没有任何文件头信息。可能是vs对于无bom的utf8不认识吧，默认把它当成了ANSI编码，所以造成这个问题。

看到一篇博客说vs2008，创建的C++源文件的缺省编码方式为CP936，即GB2312

转载于:https://www.cnblogs.com/zhishuai/p/7811855.html

weixin_30895603

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题

编译tesseract - ocr时各种不通过也很疑惑，完全按照官方指导来的啊首先以为是vs的编码问题，随切换选项-切换Unicode或多编码字符集，但仍无效。定位到乱码的文件，用notepad++ 打开，查看编码，是“”“以UTF-8无BOM格式编码”，切换成utf-8编码，将所有有中文的编码都切换了（还好只有两个），然后编译既然成功了。然后新建了一个工程，一路默认创建。打开默认...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。