文本文件字符集转换
windows:
通过编辑文件另存为,默认字符集为文本当前字符集,可选择其他字符集保存(选择较少)
linux:
可通过iconv -l 查看系统支持的字符集,不支持会报"未知xxx处的非法输入序列"
通过file filename 查看文件字符集(-i 强制显示文件字符集,**unknown-8bit未理解,请指教)
例:将一个UTF8格式的txt文件转换成GB2312格式并另存为*.txt.new
iconv -f UTF8 -t GB2312 *.txt > *.txt.new
参考:
*****************************gg***************************************************
转换后发现新文件开头多了??字符,继续搜
UTF8区别其他文件的BOM(byte order mark)问题
参考: