[20180503]珅与分隔符.txt

[20180503]珅与分隔符.txt

--//今天再次遇到分隔符问题,以前也遇到过做一次,链接.http://blog.itpub.net/267265/viewspace-763696/
--//这个"珅"还是许多人喜欢作为名字使用..

$ cat d1.txt
123|张飞珅test|aaa1

$ cat d1.txt  | tr '|' '\n'
123
张飞?
test
aaa1

--//这样被分割成4个字段,导致错误.

$ echo 珅 | xxd -c 16
-bash: syntax error near unexpected token `|'

--//因为"珅" 编码包含字符"|",出现错误.要使用引号

$ echo -n "珅" | xxd -c 16
0000000: ab7c                                     .|

--//可以"珅"的编码是ab7c,而7c的编码对应的就是"|".

$ echo -n "|" | xxd -c 16
0000000: 7c                                       |

--//这样导致分割出现错误.实际上这个字符不属于GB2312编码表.
--//以前通过这个脚本定位:
select upper(TO_CHAR (167+rownum,'xxxxxxxxxxxxx')) "10to16",chr(167+rownum)||'|' from dual connect by level+167<=254;
--//但是仅仅对数据库字符集AMERICAN_AMERICA.US7ASCII有效.
--//对于字符集AMERICAN_AMERICA.ZHS16GBK可以使用如下查询:

SELECT hex, UTL_RAW.cast_to_varchar2 (hex) hz
  FROM (    SELECT TO_CHAR (167 + ROWNUM, 'FMxx') || '7c' hex
              FROM DUAL
        CONNECT BY LEVEL + 167 <= 254);



转载于:https://www.cnblogs.com/lfree/p/8986104.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值