操作系统文件换行符
首先介绍下,在ASCII中存在这样两个字符CR(编码为13)和 LF(编码为10),在编程中我们一般称其分别为'\r'和'\n'。他们被用来作为换行标志,但在不同系统中换行标志又不一样。下面是不同操作系统采用不同的换行符:
- Unix和类Unix(如Linux):换行符采用 \n
- Windows和MS-DOS:换行符采用 \r\n
- Mac OS X之前的系统:换行符采用 \r
- Mac OS X:换行符采用 \n
Linux中查看换行符
在Linux中查看换行符的方法应该有很多种,这里介绍两种比较常用的方法。
第一种使用"cat -A [Filename]" 查看,如下图所示,看到的为一个Windows形式的换行符,\r对应符号^M,\n对应符号$.
第二种使用vi编辑器查看,然后使用"set list"命令显示特殊字符:
咦,细心的朋友发现了,怎么^M还是没显示出来,这里也是给大家提个醒,用VI的二进制模式(“vi -b [FileName]”)打开,才能够显示出^M:
Windows换行符转换为Linux格式
下面介绍三种方法,选择哪一种看自己喜好,当然你也可以选择第x种,^_^。
(1)第一种使用VI: 使用VI普通模式打开文件,然后运行命令"set ff=unix" 则可以将Windows 换行符转换为Linux换行符,简单吧!命令中ff的全称为file encoding。
(2)使用命令"dos2unix",如下所示
[root@localhost test]# dos2unix gggggggg.txt
dos2unix: converting file gggggggg.txt to UNIX format ...
(3)使用sed命令删除 \r字符:
[root@localhost test]# sed -i 's/\r//g' gggggggg.txt
多文件处理换行符转换
通常我们都会有一批文件需要替换,比如一个目录的都要替换,我自己写了一个简单的脚本去遍历目录和子目录下的所有文件,并且将其转换为Linux换行格式。代码如下:
#!/bin/sh
#CheckInput
#Check Whether the input is valid
#0 means not valid
CheckInput()
{
ret=1;
#Check the number of parameter
#And Check whether the argument is a folder
if [ $# -lt 1 ]
then
echo "Please use the command like ./dos2u.sh [Folder]";
ret=0
elif [ ! -d $1 ]
then
echo "Please use an invalid Folder as the shell argument";
ret=0
fi
return $ret;
}
#TraverseFolder
#Traser all the files under the folder
TraverseFolder()
{
oldPath=`pwd`
cd $1;
for file in `ls`
do
if [ -d $file ]
then
TraverseFolder $file;
else
#echo $file;
#sed -i 's/\r//g' $file
dos2unix $file
fi
done
cd $oldPath;
}
CheckInput $*
if [ $ret -ne 1 ]
then
exit -1
fi
TraverseFolder $1