中文编码及绘制

最近一个任务是判断一个字符串是不是中文,并将其绘制到一个jpg文件上。对于编码一直挺糊涂的,这次梳理了一下。

对于一个文件,可以使用file -i a.txt查看它的编码格式(不知怎么回事,我的终端是utf-8,在vim中输入中文时,老是出现乱码,只能在notepad++中编辑好之后再上传到linux上,可能是vim的设置有问题。)当终端和文件的编码方式一致时,就能显示正常的中文。

回到c++,当你写了char *str = "一二三四五六七八";时,其实这段文字在内存中是使用utf-8方式(默认,下同)编码的。所以这个字符串的长度是编码的长度加上"\0"共25。当你用printf把这段文字打印出来时,和前面文本文档是一样的。保存字符串,还有一种方式是使用wchar_t的方式,这种方式对应的就是unicode。这种方式的赋值方式为wchar_t *str = L"一二三四五六七八";,前面的L是告诉编译器,将这段字符最为宽字节进行内存分配。wchar_t在Windows下是2个字节,在Linux下是4个字节。这样,这个宽字符串的长度就是字符长度8加上一个结尾的符号,为9。这时候每个字符和中文是一一对应的。比如,str[0]的值就是19968,对应的就是“一”这个中文的unicode编码0x4e00。这时直接用printf打印是有乱码的,可以使用"%ls"进行打印,告诉函数打印的是宽字符,或者使用wprintf进行打印。

另外就是普通字符串和宽字符字符串之间转换,可以使用mbstowcs和wcstombs函数,但是直接调用,会失败,errno为48,我上网查了一下,需要在调用之前设置setlocale(LC_CTYPE, "en_US.UTF-8"); 或者setlocale(LC_ALL, "");,原因我也不太懂。

最后是绘制文字,Opencv是没办法直接绘制文字的,需要加载相应的文字库,而且需要结合freetype的库(网上的好像有点问题,我修改了一下),看代码还是比较简单的。

ps:test.tar是一个更简洁的使用例子
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 OpenCV 中绘制中文时,可能会遇到乱码问题。这是因为 OpenCV 默认使用的是 ASCII 编码,而中文需要使用 Unicode 编码。为了解决这个问题,可以按照以下步骤操作: 1. 将要绘制中文字符串转换为 Unicode 编码,可以使用 Qt 的 QString 类进行转换。 2. 将 Unicode 编码转换为 UTF-8 编码,可以使用 ICU 库进行转换。 3. 使用 OpenCV 的 putText 函数绘制 UTF-8 编码的字符串。 下面是一个示例代码: ``` #include <opencv2/opencv.hpp> #include <QString> #include <unicode/ucnv.h> int main() { // 要绘制中文字符串 QString text = QString::fromUtf8("你好,世界!"); // 将字符串转换为 Unicode 编码 std::u16string utf16 = text.toStdU16String(); // 将 Unicode 编码转换为 UTF-8 编码 UErrorCode status = U_ZERO_ERROR; UConverter* utf8_converter = ucnv_open("UTF-8", &status); std::string utf8; utf8.resize(utf16.size() * 3); int32_t utf8_length = ucnv_fromUChars(utf8_converter, &utf8[0], utf8.size(), reinterpret_cast<const UChar*>(utf16.data()), utf16.size(), &status); utf8.resize(utf8_length); // 创建一个黑色图像 cv::Mat img = cv::Mat::zeros(100, 200, CV_8UC3); // 在图像上绘制字符串 cv::putText(img, utf8, cv::Point(10, 50), cv::FONT_HERSHEY_SIMPLEX, 1.0, cv::Scalar(0, 0, 255), 2); // 显示图像 cv::imshow("image", img); cv::waitKey(); return 0; } ``` 在上面的代码中,我们使用了 Qt 的 QString 类将中文字符串转换为 Unicode 编码,然后使用 ICU 库将 Unicode 编码转换为 UTF-8 编码。最后,我们使用 OpenCV 的 putText 函数在图像上绘制字符串。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值