windows 文档导入linux中的一些特殊字符

http://diguojin.blog.51cto.com/5034509/1422915

windwoslinux 文档文件 导入 问题 ^M 回车 换行 区别 整理

 

参考文档:

http://www.cnblogs.com/zhyg6516/archive/2010/11/11/1875231.html(成长日记)

http://dadoneo.iteye.com/blog/984725(认真你就赢了)

http://blog.csdn.net/wzb56_earl/article/details/6860358(wzb56的资料库)

1.      问题来源(背景):

 

“回车”(carriage return)VS “换行”(line feed)

 

在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

 

于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。

 

这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

 

后来,计算机发明了,这两个概念也就被用到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。

 

Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

 

2.     区别:

换行符:

A     windows中的换行符是\r\n,

B     linux/unix下的换行符是\n。

其中:

回车符:\r=0x0d  (13)          return; #回车(carriage return) 

换行符:\n=0x0a (10)           newline。#换行(newline)

3.     解决方法

排错思路,首先确定问题。

先看下我的文档

1
2
3
#!/bin/bash
echo  hahaha
echo   whwhwhw

这是在windows下编辑的文档。乍一看去没有问题,但是无法执行。

1
2
3
4
5
[diguojin@localhost public]$ . /test .sh 
. /test .sh: line 1:  #!/bin/bash: 没有那个文件或目录
hahaha
whwhwhw
[diguojin@localhost public]$

确定问题

1
2
3
4
5
6
7
[diguojin@localhost public]$  file  test .sh 
test .sh: UTF-8 Unicode (with BOM) text
[diguojin@localhost public]$  cat  -A  test .sh 
M-oM-;M-? #!/bin/bash$
echo  hahaha$
echo   whwhwhw$
[diguojin@localhost public]$

发现问题了把,在#开头之前有奇怪的符号,M-oM-;m-? 这个是utf-8的bom,在win下用笔记本保存成utf-8格式出现的,我们需要用不带bom的utf-8,来转换下格式,重新保存ok

1
2
3
[diguojin@localhost public]$ . /test .sh 
hahaha
whwhwhw




还可能有其他情况比如出现^M 用一下方法即可解决

把windows文件格式转换为linux文件格式方法

A    

1
  unix2dos filename

:将具有unix风格的格式文件转化为具有window下的格式文件。

B    

1
dos2unix filename

:将具有windows风格的格式文件转化为unix下的格式文件。

C     是用VI的命令:使用vi打开文本文件

   

1
vi  dos.txt


    命令模式下输入

   

1
: set  fileformat=unix


   

1
  :w


D     VI下使用正则表达式替换

    

1
g/\^M /s/ \^M //


    或者

  

1
  %s/^M //g


E    

1
  sed  ’s/^M // ’ filename > tmp_filename

Ctrl+v+m 相当于Ctrl+v 输出‘^’.如果用shift+6 则不可以。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值