windwoslinux 文档文件 导入 问题 ^M 回车 换行 区别 整理

 

参考文档:

http://www.cnblogs.com/zhyg6516/archive/2010/11/11/1875231.html(成长日记)

http://dadoneo.iteye.com/blog/984725(认真你就赢了)

http://blog.csdn.net/wzb56_earl/article/details/6860358(wzb56的资料库)

1.      问题来源(背景):

 

“回车”(carriage return)VS “换行”(line feed)

 

在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

 

于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。

 

这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

 

后来,计算机发明了,这两个概念也就被用到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。

 

Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

 

2.     区别:

换行符:

A     windows中的换行符是\r\n,

B     linux/unix下的换行符是\n。

其中:

回车符:\r=0x0d  (13)          return; #回车(carriage return) 

换行符:\n=0x0a (10)           newline。#换行(newline)

3.     解决方法

排错思路,首先确定问题。

先看下我的文档

#!/bin/bash
echo hahaha
echo  whwhwhw

这是在windows下编辑的文档。乍一看去没有问题,但是无法执行。

[diguojin@localhost public]$ ./test.sh 
./test.sh: line 1: #!/bin/bash: 没有那个文件或目录
hahaha
whwhwhw
[diguojin@localhost public]$

确定问题

[diguojin@localhost public]$ file test.sh 
test.sh: UTF-8 Unicode (with BOM) text
[diguojin@localhost public]$ cat -A test.sh 
M-oM-;M-?#!/bin/bash$
echo hahaha$
echo  whwhwhw$
[diguojin@localhost public]$

发现问题了把,在#开头之前有奇怪的符号,M-oM-;m-? 这个是utf-8的bom,在win下用笔记本保存成utf-8格式出现的,我们需要用不带bom的utf-8,来转换下格式,重新保存ok

[diguojin@localhost public]$ ./test.sh 
hahaha
whwhwhw




还可能有其他情况比如出现^M 用一下方法即可解决

把windows文件格式转换为linux文件格式方法

A    

 unix2dos filename

:将具有unix风格的格式文件转化为具有window下的格式文件。

B    

dos2unix filename

:将具有windows风格的格式文件转化为unix下的格式文件。

C     是用VI的命令:使用vi打开文本文件

   

vi dos.txt


    命令模式下输入

   

:set fileformat=unix


   

 :w


D     VI下使用正则表达式替换

    

g/\^M/s/\^M//


    或者

  

 %s/^M//g


E    

 sed ’s/^M//’ filename > tmp_filename

Ctrl+v+m 相当于Ctrl+v 输出‘^’.如果用shift+6 则不可以。