windwoslinux 文档文件 导入 问题 ^M 回车 换行 区别 整理
参考文档:
http://www.cnblogs.com/zhyg6516/archive/2010/11/11/1875231.html(成长日记)
http://dadoneo.iteye.com/blog/984725(认真你就赢了)
http://blog.csdn.net/wzb56_earl/article/details/6860358(wzb56的资料库)
1. 问题来源(背景):
“回车”(carriage return)VS “换行”(line feed)
在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。
这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。
后来,计算机发明了,这两个概念也就被用到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。
Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。
2. 区别:
换行符:
A windows中的换行符是\r\n,
B linux/unix下的换行符是\n。
其中:
回车符:\r=0x0d (13) return; #回车(carriage return)
换行符:\n=0x0a (10) newline。#换行(newline)
3. 解决方法
排错思路,首先确定问题。
先看下我的文档
#!/bin/bash echo hahaha echo whwhwhw
这是在windows下编辑的文档。乍一看去没有问题,但是无法执行。
[diguojin@localhost public]$ ./test.sh ./test.sh: line 1: #!/bin/bash: 没有那个文件或目录 hahaha whwhwhw [diguojin@localhost public]$
确定问题
[diguojin@localhost public]$ file test.sh test.sh: UTF-8 Unicode (with BOM) text [diguojin@localhost public]$ cat -A test.sh M-oM-;M-?#!/bin/bash$ echo hahaha$ echo whwhwhw$ [diguojin@localhost public]$
发现问题了把,在#开头之前有奇怪的符号,M-oM-;m-? 这个是utf-8的bom,在win下用笔记本保存成utf-8格式出现的,我们需要用不带bom的utf-8,来转换下格式,重新保存ok
[diguojin@localhost public]$ ./test.sh hahaha whwhwhw
还可能有其他情况比如出现^M 用一下方法即可解决
把windows文件格式转换为linux文件格式方法
A
unix2dos filename
:将具有unix风格的格式文件转化为具有window下的格式文件。
B
dos2unix filename
:将具有windows风格的格式文件转化为unix下的格式文件。
C 是用VI的命令:使用vi打开文本文件
vi dos.txt
命令模式下输入
:set fileformat=unix
:w
D VI下使用正则表达式替换
g/\^M/s/\^M//
或者
%s/^M//g
E
sed ’s/^M//’ filename > tmp_filename
Ctrl+v+m 相当于Ctrl+v 输出‘^’.如果用shift+6 则不可以。
转载于:https://blog.51cto.com/diguojin/1422915