tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题

编译tesseract - ocr时 各种不通过 也很疑惑,完全按照官方指导来的啊

首先以为是vs的编码问题,随切换选项-切换Unicode或多编码字符集,但仍无效。

定位到乱码的文件,用notepad++ 打开,查看编码,是“”“以UTF-8无BOM格式编码”,切换成utf-8编码,将所有有中文的编码都切换了(还好只有两个),然后编译既然成功了。

然后新建了一个工程,一路默认创建。打开默认创建的cpp文件,是ANSI编码,没有任何文件头信息。可能是vs对于无bom的utf8不认识吧,默认把它当成了ANSI编码,所以造成这个问题。

看到一篇博客说vs2008,创建的C++源文件的缺省编码方式为CP936,即GB2312

 

转载于:https://www.cnblogs.com/zhishuai/p/7811855.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值