问题:
在本问题中,我使用的是sed命令,但该情况不限于该命令。
sed -n "1, 700p" /.../SourceFile > ./NewFile
如不重定向,sed -n输出内容正常。
但通过通过vim打开重定向的新文件file1后都是 @a@b@c@d 这样的乱码,图片因安全限制就不发送了,看到这个应该也明白是不是自己遇到的问题了。
解决方案:
最大概率导致乱码的原因就是字符集不同。
我们先要通过file命令,检查源文件 SourceFile 和重定向后的新文件NewFile的字符集是否相同?
file /.../SourceFile
file ./NewFile
字符集一般显示在输出结果的第二列。
在我遇到的问题中,SourceFile的字符集为UTF-16,而sed -n重定向后的文件NewFile的字符集为UTF-8。
那么现在,我们需要把源文件通过生成一个不同字符集的新文件的方式进行转换,从UTF-16转换为UTF-8之后,再通过sed命令进行打印等操作,这个时候我们需要使用到 iconv命令:
iconv -f UTF-16 -t UTF-8 /.../SourceFile -o /.../SourceFile_Changed
参数说明:
-f: 指定输入文件编码
-t: 指定输出文件编码
/…/SourceFile: 指定输入文件
-o: 指定输出文件
/…/SourceFile_Changed: 指定输出文件
这个时候我们再通过file命令确定生成的新文件 SourceFile_Changed的字符集:
file /.../SourceFile_Changed
确定字符集成功更改之后,再使用sed命令重定向SourceFile_Changed,用vim打开发现正常了。