键盘打不出来的特殊符号的统计与替换【JAVA实现】【有缺憾】

键盘打不出来的特殊符号的统计与替换【JAVA实现】【有缺憾】

一、起因

最近开始的工作涉及了一些关于文件处理的内容,为了把各种乱七八糟的东西都弄成同一种样式,着实动了一番小心思。

在各种处理流程当中,最令人头疼的果然还是那些键盘上找不到的特殊符号。

如果还没反应过来我指的是哪些字符的话,下面放了一些例子:

✳✴✵✶✷✸✹✺✻✼❄❅❆❇❈❉❊†☨✞✝☥☦☓☩☯☧☬☸✡♁

虽说平时在各种社交平台中都能见到这种东西,但是要处理这些果然还是太过勉强了。

二、过程

最开始还是想直接设置一个对照组,直接把文件中的特殊字符给替换掉。这种方式比较简单。不过最大的痛点就是,需要一个完整的对照组,不然谁都不知道会不会有什么不在对照组里面的东西出来捣乱。

这时候就轮到了反向思维,于是便自然地转而用正则表达式过滤出正常的中英文字符,加上有限的一般特殊字符。但是这样就有了一个问题,那就是——无法测算到底处理掉了多少个需要处理的特殊字符。

此时的我还在思考到底应该如何解决计数问题,然而无意间翻阅html文档的时候我又发现,除了少数诸如 卍卐 之类的字符以外,在html文档中,绝大多数特殊字符都是以 '&#number' 的形式存在的。

迷茫。

三、处理方案

最后,面对统计数目的需要,还是放弃了将所有特殊符号一网打尽的做法。

需求一旦变为有限的对照组,事情顿时简单了不知道多少倍。

虽然这么做确实有些蠢,但是在大多数情况下,应该不会有人拿着像是 《世界特殊符号大全》 之类的奇怪东西来摆弄把?

不知道会不会有懂得如何处理这种需求的大佬来指点一番呢?

总之,今天也是被放弃的一天。

(喝茶)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值