C语言中的中文处理的问题。

首先Windows下的默认编码是 ANSI,其中中文就是GBK编码。

Linux下中文编码是UTF-8。

换行符的区别。  Windows下是\r\n,Linux下是\n。

其中我在Windows下建立的文本文件,在Linux下加一个换行后,用getchar( )查看,还是增加了一个\r\n。

由此猜测换行符是什么取决于在哪个系统下建立。   但似乎也不太对。。

则比如从UTF-8编码的文本读取汉字,直接输出在Linux下,不会乱码,因为都是UTF-8.

同理,从编码GBK的文件读取,在Windows下也不会乱码。

所以推荐在Windows下保存为GBK,Linux下为没有BOM的UTF-8。

如果汉字直接写在代码里,则汉字的编码就取决于环境,其中vs下为GBK编码,MinGW下为UTF-8编码。

以后了解深入后再补充。

Linux 命令

dos2UNIX  file // 把file文件从dos改成UNIX型。 dos为WIN下文件,换行与Linux不同。  
UNIX2dos  file  // 相反。

iconv -f 原本编码  -t 目标编码  filename  -o newfile  //把filename文件从f变成t编码,新文件保存为newfile
eg: iconv  -f big5 -t utf8  xx.big5  -o xx.utf8  // 


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值