DOS和Linux换行符


2010-08-30 10:50:45|  分类: Linux |字号 订阅

计算机还没有出现之前,有一种叫做电传打字机(Teletype Model33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。Unix系统里,每行结尾只有“”,即“\n”;Windows系统里面,每行结尾是“”,即“\
n\r”;Mac系统里,每行结尾是“”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

DOS/Windows和Linux/Unix的文件换行回车格式不同,基于 DOS/Windows 的文本文件在每一行末尾有一个 CR(回车)和 LF(换行),而 UNIX 文本只有一个换行。

*********************************************************************************************************************************************************

1)把Dos/Windows下的文件移至Linux/Unix系统

虽然很多程序不在乎 DOS/Windows 格式的 CR/LF 文本文件,但是有几个程序却在乎 -- 最著名的是 bash,只要一遇到回车,它就会出问题。以下 sed 调用将把 DOS/Windows 格式的文本转换成可信赖的 UNIX 格式:

$ sed -e 's/.$//' mydos.txt > myunix.txt

该脚本的工作原理很简单:替代规则表达式与一行的最末字符匹配,而该字符恰好就是回车。我们用空字符替换它,从而将其从输出中彻底删除。如果使用该脚本并注意到已经删除了输出中每行的最末字符,那么,您就指定了已经是 UNIX 格式的文本文件。也就没必要那样做了!

2)把Linux/UNIX 文本移至 Windows 系统,使用以下脚本执行必需的格式转换:

$ sed -e 's/$/\r/' myunix.txt > mydos.txt

在该脚本中,'$' 规则表达式将与行的末尾匹配,而 '\r' 告诉 sed 在其之前插入一个回车。在换行之前插入回车,立即,每一行就以 CR/LF 结束。请注意,仅当使用 GNU sed 3.02.80 或以后的版本时,才会用 CR 替换 '\r'。

*********************************************************************************************************************************************************

使用系统命令转换

曾经提到过DOS与 Linux换行符的不同。我们利用cat -A来观察以DOS(Windows系统)建立的特殊文件格式,也可以发现,在DOS使用的换行符为 ^M$,我们称为CR与LF两个符号。而在Linux中,则仅有LF ($) 这个换行符。这个换行符对于Linux的影响很大。

我们说过,在开始执行Linux命令时,它的判断依 据是“Enter”,而Linux的Enter为LF符号。不过,由于DOS的换行符是CRLF,就是多了一个 ^M的符号,在这样的情况下,如果是一个shell脚本的程序文件,将可能造成“程序无法执行”的状态,因为它会误判程序的命令内容。

怎么办?很简单,将格式转换为Linux即可。要以vi进入该文件,然后一个一个地删除CR吗?当然不是。我们可以通过简单的命令来进行格式的转换。

[root@linux ~]# dos2unix [-kn] file [newfile]

[root@linux ~]# unix2dos [-kn] file [newfile]

参数:

-k  : 保留该文件原来的mtime时间格式(不更新文件上次内容经过修改的时间)

-n  : 保留原来的旧文件,将转换后的内容输出到新文件,如:dos2unix -n old new

范例:

范例一:将提供的hosts文件格式更新为dos格式。

[root@linux ~]# unix2dos -k hosts

unix2dos: converting file hosts to DOS format ...

# 此时hosts文件的时间不会改变,但内容主要将换行符修改成为DOS的CRLF了。

范例二:将范例一已经变成DOS格式的hosts改名为hosts.dos,并且转换Linux

        格式到hosts.linux

[root@linux ~]# mv hosts hosts.dos

[root@linux ~]# dos2unix -k -n hosts.dos hosts.linux

dos2unix: converting file hosts.dos to file hosts.linux in UNIX format ...

[root@linux ~]# ll

-rw-r--r--  1 root root      288 Aug  1 13:30 hosts.dos

-rw-------  1 root root      279 Aug  1 13:30 hosts.linux

# 由于DOS格式中多了CR字符,所以,文件比较大。

因为换行符以及DOS与Linux操作系统中一些字 符的定义不同,因此,建议不要在Windows系统中将文件编辑好之后,才上传到Linux系统,这样容易发生错误。而且,如果在不同的系统之间复制一些 纯文本文件时,千万要使用unix2dos或dos2unix来转换格式。

 

CR, LF, CR/LF是不同操作系统上使用的换行符.
Dos和windows采用回车+换行CR/LF表示下一行, 
而UNIX/Linux采用换行符LF表示下一行,
苹果机(MAC OS系统)则采用回车符CR表示下一行.
CR用符号'\r'表示, 十进制ASCII代码是13, 十六进制代码为0x0D; 
LF使用'\n'符号表示, ASCII代码是10, 十六制为0x0A.
所以Windows平台上换行在文本文件中是使用 0d 0a 两个字节表示, 而UNIX和苹果平台上换行则是使用0a或0d一个字节表示.
一般操作系统上的运行库会自动决定文本文件的换行格式. 如一个程序在windows上运行就生成CR/LF换行格式的文本文件,而在Linux上运行就生成LF格式换行的文本文件.
在一个平台上使用另一种换行符的文件文件可能会带来意想不到的问题, 特别是在编辑程序代码时. 有时候代码在编辑器中显示正常, 但在编辑时却会因为换行符问题而出错.
很多文本/代码编辑器带有换行符转换功能, 使用这个功能可以将文本文件中的换行符在不同格式单互换.
在不同平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换. 经过这种传输的文件字节数可能会发生变化. 如果你不想ftp修改原文件, 可以使用bin模式(二进制模式)传输文本.

标志符号十进制Asscii码数                   十六进制数                              
CR \r                          13  0x0D
LF\n 100x0A

标志Win/Doslinux,Unix等
换行 \r\n     (<CR><LF>)                \n       (<LF>)        




CR LF的含义是“carriage return/line feed”,意思就是回车。这是两个ASCII字符,分别排在第十三和第十位。CR和LF是在计算机终端还是电传打印机的时候遗留下来的东西。电传打字机就像普通打字机一样工作。在每一行的末端,CR命令让打印头回到左边。LF命令让纸前进一行。虽然使用卷纸的终端时代已经过去了,但是,CR和LF命令依然存在,许多应用程序和网络协议仍使用这些命令作为分隔符。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值