c2a0 这样的空格 NO-BREAK SPACE

ascii中的空格,编码是 32, 040 或者 x20。

在UTF-8编码里面存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候表现为一个半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的宽度不会被压缩,所以排版中常能用到它。但是GB2312、Unicode之类并没有这样的字符

http://www.utf8-chartable.de/unicode-utf8-table.pl?utf8=dec
NO-BREAK SPACE

可以通过od命名查看

[root@172.18.4.100 fupeng]# od -t x1 bad                 
0000000 c2 a0 0a

这种空格有危害, 会让SQL报错 ,也会使得Python程序无法执行。

删除这样的空格可以使用tr命令

[root@172.18.4.100 fupeng]# tr -d "\302\240" < bad > good  

替换这样的空格可以使用

cat bad| tr "\302\240" " " 

或者

cat a.py | tr -d "\302"| tr "\240"   " " > c.py 

如果还有中文,就糟糕了 ,中文会乱码。

http://www.cnblogs.com/mingmingruyuedlut/archive/2012/07/04/2575180.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值