使用Pattern、Matcher来实现搜索高亮显示

需求很简单,做一个搜索功能,要求搜索结果高亮显示。
1、最简单直接的方法,使用string的indexOf方法,来获取关键字的为准,然后做高亮处理。但是这样如果文本里多次出现关键字,就不太好弄了;
2、使用正则表达式判断:
使用正则表达式当然是一个好办法,但是很少人能直接写出正则表达式,那怎么办呢?别急Java里自带了封装好的类来帮助我们实现,它就是Pattern和Matcher!
具体用法大家可以自己去百度Google一下,这里不详细介绍了,只说一下我在实现高亮的时候遇到的问题以及解决方法。
下面下把代码供出来:

public static SpannableStringBuilder highlight(String text, String target) {

        SpannableStringBuilder spannable = new SpannableStringBuilder(text);
        CharacterStyle span = null;

        Pattern p = Pattern.compile(target,Pattern.CASE_INSENSITIVE);
        Matcher m = p.matcher(text);
        while (m.find()) {
            span = new ForegroundColorSpan(Color.RED);
            spannable.setSpan(span, m.start(), m.end(),
                    Spannable.SPAN_EXCLUSIVE_EXCLUSIVE);
        }
        return spannable;
    }

主要就是通过SpannableStringBuilder来显示高亮,然后通过Pattern和Matcher来解析。
其中Pattern.compile(target,Pattern.CASE_INSENSITIVE); 表示不区分大小写。
本来挺好的一个功能,突然测试人员提了一个崩溃的bug,在输入框中输入“+”的时候会导致app crash。这是什么情况?自己试了一下,发现报错信息如下:


Caused by: java.util.regex.PatternSyntaxException: Syntax error in regexp pattern near index 1:
E/AndroidRuntime(17429):+
E/AndroidRuntime(17429): ^
E/AndroidRuntime(17429): at java.util.regex.Pattern.compileImpl(Native Method)
E/AndroidRuntime(17429): at java.util.regex.Pattern.compile(Pattern.java:400)

虽然知道是特殊符号导致的,但是经过测试发现并不是所有的特殊符号都会出现这个问题。
那有哪些特殊符号会导致呢?

正则表达式中有一类叫做“元字符(meta-character)”的特殊符号,它们并不匹配自身对应的字符,而具有其他的含义。比如脱字符『^』表示“定位到字符串/行的开头”,加号『+』表示“之前的元素重现1次以上。如果需要匹配这些字符本身,需要用反斜线来转义,匹配『^』就应该用\^,匹配『+』就应该用+。

看起来有点麻烦,但这样的元字符并不多:^$()*+?.[{|

这就好办了,最简单粗暴的办法就是:

final static String PATTERN_SYMBOL = "^$()*+?.[\\{|";
if (PATTERN_SYMBOL.contains(target)){
    target = "\\"+target;//对正则表达式保留符号进行转义
}

对于这些特殊符号做转义。
虽然这样可以实现,但是总觉得不够“优雅”,有没有更方便、更优雅的解决办法呢?答案是肯定的!
还记得在创建Pattern 时的flag——Pattern.CASE_INSENSITIVE,既然能不区分大小写,那能不能转义元字符呢?
点进Pattern类,发现里面定义了好多静态flag,其中有一个

 /**
     * This constant specifies that the whole {@code Pattern} is to be taken
     * literally, that is, all meta characters lose their meanings.
     */
public static final int LITERAL = 0x10;

注释大致意思就是说 所有字符都是按照字面意思来,所有的元字符都失去了它们的意义。那不正是我们想要的吗?
试了一下,果然好用!
当然有人还想不区分大小写,又要使用元字符,那怎么办呢?

Pattern p = Pattern.compile(target,Pattern.LITERAL|Pattern.CASE_INSENSITIVE);

这么写,搞定!

参考文档:
http://www.cnblogs.com/ajianbeyourself/p/5709567.html

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值