博文说明【前言】:
本文将通过个人口吻介绍Linux字符集和系统语言设置,包括LANG,locale,LC_ALL,POSIX等命令及参数详解的相关知识,在目前时间点【2017年6月21号】下,所掌握的技术水平有限,可能会存在不少知识理解不够深入或全面,望大家指出问题共同交流,在后续工作及学习中如发现本文内容与实际情况有所偏差,将会完善该博文内容。
本文参考文献引用链接:
1、http://blog.csdn.net/z4213489/article/details/7937894【好文,必看】
2、http://www.360doc.com/content/14/0103/13/10384031_342301450.shtml【各种格式区别讲解的比比较详细,必看】
正文:
一:字符集部分
字符集就是:01二进制数据<--到-->字符的对应关系表(也可以称为对应关系数据库,对应关系集合)
示例:
假设这是utf8字符集对应关系:
00010101----例
10101100----如
假设这是GBK字符集对应关系:
00010101----乱
10101100----码
讲解:
我们可以很清楚的看到,相同一段数据,使用不同的字符集,会有不同的显示结果,这就是我们乱码现象的根源,因为不同字符集组织数据的方式不一样。
ps:浏览器展示网页时,网页内容使用字符集如果和系统字符集不一致,一般也不会发生乱码现象(英文的windows系统能正常看中文页面),因为浏览器在获取网页文件时,浏览器会做一个判断,识别网页内容使用的字符集,然后使用相对应字符集去显示页面内容,注