非非打印字符

有时文本值包含前导、尾部或多个嵌入空格字符(Unicode 字符集 (Unicode:Unicode Consortium 开发的一种字符编码标准。该标准采用多(于一)个字节代表每一字符,实现了使用单个字符集代表世界上几乎所有书面语言。)值 32 和 160),或者非打印字符(Unicode 字符集值 0 到 31、127、129、141、143、144 和 157)。在您执行排序、筛选或搜索时,这些字符有时会导致意外结果。例如,用户可能由于不慎添加额外空格字符而导致录入错误,或者从外部源导入的文本数据可能包含在文本中嵌入的非打印字符。由于这些字符不容易引起注意,可能会导致难于理解的意外结果。要解决这些不需要的字符,您可以结合使用 TRIM、CLEAN 和 SUBSTITUTE 函数。

TRIM 函数删除文本中除单词之间的单个空格外的所有空格。CLEAN 函数删除文本中的所有非打印字符。这两个函数都设计用于 7 位 ASCII,它是 ANSI 字符集 (ANSI 字符集:Microsoft Windows 使用的 8 位字符集,允许您使用键盘表示多达 256 个字符(0 到 255)。ASCII 字符集是 ANSI 集的子集。)的一个子集。7 位 ASCII 中的前 128 个值(0 到 127)与 Unicode 字符集中的前 128 个值代表相同的字符,了解这一点很重要。

TRIM 函数设计用于清除文本中的 7 位 ASCII 空格字符(值 32)。在 Unicode 字符集中,有一个称为不间断空格字符的额外空格字符,其十进制值为 160。该字符通常在网页中用作 HTML 实体  。TRIM 函数本身不删除此不间断空格字符。

CLEAN 函数设计用于删除文本中 7 位 ASCII 代码中的前 32 个非打印字符(值 0 到 31)。在 Unicode 字符集中,有附加的非打印字符(值为 127、129、141、143、144 和 157)。CLEAN 函数自身不删除这些附加的非打印字符。

要执行此任务,请使用 SUBSTITUTE 函数用 7 位 ASCII 字符(TRIM 和 CLEAN 函数就是为这些字符设计的)替换较高值的 Unicode 字符。


参考:http://jeck218.iteye.com/blog/377337
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值