centos7-中文字符集

本文详细介绍了字符编码的原理,包括ASCII、Unicode和各种中文编码如GB2312、GBK、GB18030。在Linux(CentOS7)环境中,针对可能出现的中文乱码问题,讲解了如何查看和设置系统字符集,并提供了安装和切换中文字符集的步骤。此外,还介绍了编码转换工具iconv的使用,用于解决不同编码间的转换问题,以避免乱码现象。
摘要由CSDN通过智能技术生成


一、字符编码


1、计算机编码

ASCII


2、国际编码

Unicode(UTF-8、UTF-16、UTF-32)
Unicode 将全球所有的字符统一编码,解决了字符集不兼容和字符转换的问题。全世界通用。


3、中文编码

GB2312
GB2312-80字符集,国家标准字符集(GB国标)。收入汉字6763个普遍使用的简体字字符集。

GBK
GBK字符集,国家标准扩展字符集(GB国标;K,即扩展),兼容GB2312-80标准。

GB18030
GB18030字符集,包含GBK字符集,共计27533个汉字。

常用的中文编码
GBK、GB18030、Unicode
GBK和GB18030占用空间小,Unicode通用性强,占用空间大。
不考虑全球通用,实际应用还是选择GBK和GB18030。


二、Linux(CentOS7)字符集设置


查看系统字符集

locale

查看系统安装的字符集


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值