[iconv] linux系统下与原系统字符编码转换陷阱

original Link: http://blog.csdn.net/userguanguan/article/details/6393310


/桌面$ file 备忘录.txt
备忘录.txt: ISO-8859 text, with CRLF line terminators

 

于是用

/桌面$ iconv -f ISO-8859 -t utf-8 备忘录.txt>备忘录.txt

 

ERROR:

iconv: 不支持以“ISO-8859”为源头的转换
试用“iconv --help”或“iconv --usage”以获取更多信息。


后来才发现

file命令。不靠谱

 

于是:

把此文件托到Firefox,查看编码为GB2312

 

/桌面$:iconv -f GB2312 -t utf-8 备忘录.txt>备忘录.txt

GB2312 is windows platform.


http://blog.csdn.net/xiaobai1593/article/details/7072001


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux 系统下,可以使用 iconv 函数库将字符编码从 UTF-8 转换为 GBK 编码。 具体的实现步骤如下: 1. 包含头文件 `#include <iconv.h>` 2. 定义 iconv_t 变量,用于存储转换句柄。 3. 调用 iconv_open 函数打开转换句柄。 4. 准备源字符串和目标字符串的缓冲区,以及它们的长度。 5. 调用 iconv 函数进行转换。 6. 关闭转换句柄。 7. 释放缓冲区。 下面是一个简单的示例代码: ```cpp #include <iostream> #include <iconv.h> #include <cstring> int main() { // 源字符串 const char* str_utf8 = u8"这是一段 UTF-8 编码字符串。"; // 转换句柄 iconv_t cd = iconv_open("GBK", "UTF-8"); if (cd == (iconv_t)-1) { perror("iconv_open"); return -1; } // 源字符串的长度和目标字符串的缓冲区 size_t len_utf8 = strlen(str_utf8); size_t len_gbk = len_utf8 * 2; // 预留足够的空间 char* str_gbk = new char[len_gbk]; // 进行转换 char* inbuf = const_cast<char*>(str_utf8); char* outbuf = str_gbk; size_t inlen = len_utf8; size_t outlen = len_gbk; if (iconv(cd, &inbuf, &inlen, &outbuf, &outlen) == (size_t)-1) { perror("iconv"); iconv_close(cd); delete[] str_gbk; return -1; } // 输出结果 std::cout << "UTF-8 编码字符串:" << str_utf8 << std::endl; std::cout << "GBK 编码字符串:" << str_gbk << std::endl; // 关闭转换句柄并释放缓冲区 iconv_close(cd); delete[] str_gbk; return 0; } ``` 需要注意的是,在实际使用过程中,可能会遇到一些编码转换失败的情况,需要根据具体的错误码进行处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值