打开出现乱码的主要原因是操作系统中文压缩方式不一致,windows对应的是gbk,linux对应的是utf8,解决这个问题只需要一个简单的命令:iconv
例:
iconv -f gbk -t utf8 test.txt >test.txt.utf8
重新打开test.txt.utf8这个文件就成功了。
下面补充一点额外知识
1.iconv命令:
输入/输出规范格式
-f,--from-code=名称 //原始文本编码
-t,--from-code=名称 //输出编码
-o,--output==FILE //输出文件
-l,--list 列举所有以知的字符集
2. 关于utf8/gbk的知识小补充:
utf8:
UTF8编码是用以解决国际上字符的一种字节编码,它对英文使用8位(一个字节),中文使用24位(三个字节)并且包括全世界所有用到的字符。
gbk:
GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification,GBK 亦采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。