linux下中文字符串转换,在Linux下使用iconv转换字符串编码

在Linux下写C程序,尤其是网络通信程序时经常遇到编码转换的问题,这里要用到iconv函数库。

iconv函数库有以下三个函数

1

2

3

4

5

6

#include

iconv_t iconv_open(const char *tocode, const char *fromcode); //return (iconv_t)-1 if failed

size_t iconv(iconv_t cd,

char **inbuf, size_t *inbytesleft,

char **outbuf, size_t *outbytesleft); //return (size_t)-1 if failed

int iconv_close(iconv_t cd); //return -1 if failed

这三个函数的功能显而易见,分别是打开一个iconv_t句柄,转换字符串以及关闭一个iconv_t句柄。其中有必要一说的是iconv函数,这个函数十分容易用错。

iconv函数的五个参数中,第一个参数是iconv句柄,第二、三个参数是需要转换的字符串的地址和长度的地址,第四、五个参数是存储结果的字符串的地址和长度的地址,注意这里传的都是地址,因为这四个参数的值都有会被iconv函数改变。iconv会逐步的将*inbuf中的字符转换到*outbuf中,并增加*inbuf指针减少*inbytesleft的值,以及增加*outbuf指针减少*outbytesleft的值。

iconv函数会因为以下四种原因停止并返回:

*input中遇到了一个非法的多字节序列,返回(size_t)-1并置errno=EILSEQ,返回时*inbuf指向非法字符的开头。

*input全部转换完,返回不可转换的字符数。

*input中遇到了一个不完整的多字节序列,返回(size_t)-1并置errno=EINVAL,返回时*inbuf指向不完整字符的开头。

*output空间不够,返回(size_t)-1并置errno=E2BIG。

以下给出一个示例函数,将一个字符串从utf-8转换成gbk后再重新转换成utf-8。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

#include

#include

#include

#include

#include

int charset_convert(const char *from_charset, const char *to_charset,

char *in_buf, size_t in_left, char *out_buf, size_t out_left) {

iconv_t icd;

char *pin = in_buf;

char *pout = out_buf;

size_t out_len = out_left;

if ((iconv_t)-1 == (icd = iconv_open(to_charset,from_charset))) {

return -1;

}

if ((size_t)-1 == iconv(icd, &pin, &in_left, &pout, &out_left)) {

iconv_close(icd);

return -1;

}

out_buf[out_len - out_left] = 0;

iconv_close(icd);

return (int)out_len - out_left;

}

int main(int argc, char *argv[]) {

char *from_str = "你好,中南。- Hello, CSU.";

char *to_str_gbk, *to_str_utf8;

int len;

//utf-8 => gbk

to_str_gbk = (char*)calloc(1, strlen(from_str) * 3);

if (-1 == (len = charset_convert("UTF-8", "GB2312", from_str,

strlen(from_str), to_str_gbk, strlen(from_str) * 3))) {

perror("UTF8=>GBK error");

}

//gbk => utf8

to_str_utf8 = (char*)calloc(1, len * 3);

if (-1 == (len = charset_convert("GB2312", "UTF-8", to_str_gbk,

len, to_str_utf8, len * 3))) {

perror("GBK=>UTF8 error");

}

//output

printf("original : %s\n", from_str);

printf("to gbk : %s\n", to_str_gbk);

printf("gbk to utf8: %s\n", to_str_utf8);

}

我用的xshell连接到虚拟机,先将terminal的编码设置为utf-8运行,结果如下

1

2

3

original : 你好,中南。- Hello, CSU.

to gbk : ţºã¬אŏ¡£- Hello, CSU.

gbk to utf8: 你好,中南。- Hello, CSU.

再将terminal的编码设置为gbk运行,结果如下

1

2

3

original : 浣犲ソ锛屼腑鍗椼€? Hello, CSU.

to gbk : 你好,中南。- Hello, CSU.

gbk to utf8: 浣犲ソ锛屼腑鍗椼€? Hello, CSU.

可见,在相应的编码下,对应的字符串能正常显示。

http://vimersu.win/blog/2014/03/04/linux-iconv/

windows下的文件到linux下乱码 iconv 修改文件编码

conv [选项...] [文件...] 有如下选项可用: 输入/输出格式规范:-f, --from-code=名称 原始文本编码-t, --to-code=名称 输出编码 信息:-l, --list ...

linux下改变文件的字符编码

首先确定文件的原始字符编码: $ file -bi test.txt 然后用 iconv 转换字符编码 $ iconv -f from-encoding -t to-encoding file &gt ...

linux下精确替换某个字符串

1.linux下精确替换某个字符串 sed -i 's/\/new/g' filename.txt 2.举例: 2.1有个文件名为filename.txt,内容如下: newd ...

怎么将linux下的项目转换成windows的VS2010下的项目?

怎么将linux下的项目转换成windows的VS2010下的项目?             不显示删除回复             显示所有回复             显示星级回复        ...

Net Core 下 Newtonsoft.Json 转换字符串 null 替换成string.Empty

原文:Net Core 下 Newtonsoft.Json 转换字符串 null 替换成string.Empty public class NullToEmptyStringResolver : De ...

linux iconv 转换文件编码

查看文件编码file -i filename 递归转换(包括子文件夹)find default -type d -exec mkdir -p utf/{} \;find default -type f ...

Linux下时间格式转换及获取方法

Linux下使用clock_gettime给程序计时 #include #include #include

让linux下的eclipse支持GBK编码

原文链接:http://leaze.blog.51cto.com/83088/195584 今天,把windows下的工程导入到了Linux下eclipse中,由于以前的工程代码,都是GBK编码的,而 ...

Python3中转换字符串编码

在使用subprocess调用Windows命令时,遇到了字符串不显示中文的问题,源码如下:#-*-coding:utf-8-*-__author__ = '$USER' #-*-coding:utf ...

随机推荐

树莓派 Linux备忘

//更新树莓派 sudo apt-mark hold raspberrypi-bootloader sudo apt-get update sudo apt-get upgrade //配置 rasp ...

UnderScore源代码阅读1

读一下underscore源代码,用于自己学习,个人理解,如果有不对的地方希望指正,谢谢 我觉着阅读的顺序按照从整体到局部,从架构到细节较好. 1.整体架构 (function() {}.call(t ...

JAVA教师:给JAVA初学者的忠告

我带过不少JAVA,C++班的课,来学习的同学很多都是初学者,一部分是急着找工作的,一部分是很感兴趣的.他们都想在短短一两个星期内掌握Java,这是不切实际的.而且这样做很容易让自己心浮气燥,难以静下 ...

<转>——网络爬虫

网络蜘蛛即Web Spider,是一个很形象的名字.把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛是通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读 ...

移动端 meta

摘自http://www.cnblogs.com/shxydx/articles/2856882.html   控制显示区域各种属性:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux下,可以使用iconv库进行Unicode编码转换。下面是一个示例代码,将Unicode字符串转换成字节数组、将字节数组转换成Unicode字符串: ```c++ #include <iconv.h> #include <string.h> #include <stdio.h> int main() { // 将Unicode字符串转换成字节数组 const char *unicode_str = u8"\u4F60\u597D"; size_t unicode_len = strlen(unicode_str); size_t buf_len = unicode_len * 4; // 一个Unicode字符最多占4个字节 char *buf = new char[buf_len]; memset(buf, 0, buf_len); iconv_t cd = iconv_open("UTF-8", "UCS-2LE"); char *in_buf = (char*)unicode_str; char *out_buf = buf; size_t in_len = unicode_len; size_t out_len = buf_len; int ret = iconv(cd, &in_buf, &in_len, &out_buf, &out_len); if (ret == -1) { perror("iconv"); return -1; } printf("字节数组: "); for (size_t i = 0; i < buf_len - out_len; ++i) { printf("%02X ", (unsigned char)buf[i]); } printf("\n"); // 将字节数组转换成Unicode字符串 char *byte_str = buf; size_t byte_len = buf_len - out_len; size_t unicode_buf_len = byte_len / 2 + 1; // 一个Unicode字符占2个字节 char *unicode_buf = new char[unicode_buf_len]; memset(unicode_buf, 0, unicode_buf_len); cd = iconv_open("UCS-2LE", "UTF-8"); in_buf = byte_str; out_buf = unicode_buf; in_len = byte_len; out_len = unicode_buf_len; ret = iconv(cd, &in_buf, &in_len, &out_buf, &out_len); if (ret == -1) { perror("iconv"); return -1; } printf("Unicode字符串: %s\n", unicode_buf); delete[] buf; delete[] unicode_buf; return 0; } ``` 需要注意的是,iconv库只能处理单个Unicode字符,如果要处理Unicode字符串,则需要将其拆分成单个Unicode字符进行转换。上面的示例代码中,使用了UCS-2LE编码,可以根据需要修改为其他编码

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值