关于win上文本和linux上文本的编码问题

本文探讨了Windows(GBK编码)与Linux(UTF-8编码)之间的文本编码差异,详细介绍了如何处理在不同系统间导致的乱码问题,包括通过locale命令、修改系统配置文件如/etc/sysconfig/i18n以及安装中文字符集等方法实现文本转换和兼容。
摘要由CSDN通过智能技术生成

Windows的默认编码为GBK,Linux的默认编码为UTF-8
[root@node1 ~]$ cat -A filename 就可以看到windows下的断元字符 ^M

闲来无聊查找了以下几种转换编码字符集的方法

1 dos2unix filename          
2 sed -i 's/^M//g' filename
3 vim filename
:1,$ s/^M//g
4 cat filename |tr -d ‘/r’ > newfile      ## ^M 可用 /r 代替

^M 输入方法: ctrl+V ,ctrl+M

locale命令
程序运行使用一套语言需要有字符集(数据)和字体(显示),Locale是根据计算机用户所使用的语言(Language),所在国家或者地域(Territory),以及当地的文化传统字符集(Codeset)所定义的一个软件运行时的语言环境。

完全的locale表达方式是 [语言[_地域][.字符集] [@修正值]。
zh_CN.GB2312=中文_中华人民共和国+国标2312字符集。

centos7中

[root@node1 ~]$ locale
locale     localectl  localedef  
[root@node1 ~]$ localectl 
list-keymaps    list-locales    set-keymap      set-locale      set-x11-keymap  status          
[root@node1 ~]$ localectl set-locale L
LANG=               LC_COLLATE=         LC_M
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值