操作系统文件换行符
首先介绍下,在ASCII中存在这样两个字符CR(编码为13)和 LF(编码为10),在编程中我们一般称其分别为'\r'和'\n'。他们被用来作为换行标志,但在不同系统中换行标志又不一样。下面是不同操作系统采用不同的换行符:
- Unix和类Unix(如Linux):换行符采用 \n
- Windows和MS-DOS:换行符采用 \r\n
- Mac OS X之前的系统:换行符采用 \r
- Mac OS X:换行符采用 \n
Linux中查看换行符
在Linux中查看换行符的方法应该有很多种,这里介绍两种比较常用的方法。
第一种使用"cat -A [Filename]" 查看,如下图所示,看到的为一个Windows形式的换行符,\r对应符号^M,\n对应符号$.
第二种使用vi编辑器查看,然后使用"set list"命令显示特殊字符:
咦,细心的朋友发现了,怎么^M还是没显示出来,这里也是给大家提个醒,用VI的二进制模式(“vi -b [FileName]”)打开,才能够显示出^M:
Windows换行符转换为Linux格式
下面介绍三种方法,选择哪一种看自己喜好,当然你也可以选择第x种,^_^。
(1)第一种使用VI: 使用VI普通模式打开文件,然后运行命令"set ff=unix" 则可以将Windows 换行符转换为Linux换行符,简单吧!命令中ff的全称为file encoding。
(2)使用命令"dos2unix",如下所示
(3)使用sed命令删除 \r 字符:
多文件处理换行符转换
通常我们都会有一批文件需要替换,比如一个目录的都要替换,我自己写了一个简单的脚本去遍历目录和子目录下的所有文件,并且将其转换为Linux换行格式。代码如下:
这个就纯当练习了,应该可以用更简单的方式去解决,比如 find 命令+ dos2unix 命令,小伙伴们可以自己试一试。我这么写 主要目的是为了 以后有其他需求更便于扩展,当然还有一些bug要修改啦~~~~^_^。
参考
1. How To Convert Files from Linux/Unix Format to Windows and Vice Versa:
https://www.maketecheasier.com/convert-files-from-linux-format-windows/
2. Difference Between \n and \r?
http://stackoverflow.com/questions/1761051/difference-between-n-and-r
3. 美国信息交换标准代码
http://baike.baidu.com/view/492542.htm