Java实现正则匹配出script标签中字符串包含某个几个单词的所有行,以及编码转换

/*取得script下面的JS变量*/  
        Elements scriptinfo = document.getElementsByTag("script").eq(21);  
        List<String> list=new ArrayList<String>();
        Map<String,String> PopWindowInfo = new LinkedHashMap<String,String>();
        /*循环遍历script下面的JS变量*/  
        for (Element script : scriptinfo) {  
            
            Pattern p=Pattern.compile("((impression|more_desc|address|phone:)"+".+?)(\",)");
            Pattern p2=Pattern.compile("((ticket_info|bestvisittime|besttime|open_time_desc)"+".+?);");  
           
            
            String sss=script.data().toString();
//            new JsonPathSelector("$..title").select(page.getRawText());
            
             System.out.println(sss);  
             Matcher m = p.matcher(sss);//与字符串匹配
             String arrq=null;
             while(m.find()){  
                 if(m.group(1).split(":\"").length>1){
                     arrq= m.group(1).split(":\"")[1];
                 }else{
                     arrq="";
                 }
                 PopWindowInfo.put(m.group(1).split(":\"")[0], convert(arrq));
                
                 // System.out.println(m.group(1).split(":\"")[0]+":"+new String(arrq.getBytes("ISO8859-1"), "GBK"));
                System.out.println(m.group(1).split(":\"")[0]+":"+ convert(arrq));  

                
        }
                             
             Matcher m2 = p2.matcher(sss);//与字符串匹配
             String arrqq=null;
             String [] stt = null;
             while(m2.find()){
                 String st="\',\\{text:\"";
                 if(m2.group(1).split(st).length>1){
//                     System.out.println(m2.group(1).split(st)[1]);
                     stt= m2.group(1).split(st)[1].split("\"}\\)");
                                 
                 if(stt.length !=0){
                     arrqq =stt[0];
                 }else{
                     arrqq="";
                 }                
                 PopWindowInfo.put(m2.group(1).split(st)[0],convert(arrqq));
//                System.out.println(m.group(1).split(":\"")[0]+":"+new String(arrq.getBytes("ISO8859-1"), "GBK"));
                System.out.println(m2.group(1).split(st)[0]+":"+convert(arrqq));

        }
                
        }

 }


public static String convert(String utfString){  
           StringBuilder sb = new StringBuilder();  
           int i = -1;  
           int pos = 0;  
             
           while((i=utfString.indexOf("\\u", pos)) != -1){  
               sb.append(utfString.substring(pos, i));  
               if(i+5 < utfString.length()){  
                   pos = i+6;  
                   sb.append((char)Integer.parseInt(utfString.substring(i+2, i+6), 16));  
               }  
           }  
             
           return sb.toString();  
        }



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回答: 在Java,可以使用正则表达式来判断一个字符串是否包含特定的字符串。可以通过使用Matcher和Pattern类来完成正则表达式的匹配。首先,需要创建一个Pattern对象,将正则表达式与之关联。然后,创建一个Matcher对象,将需要匹配的字符串与之关联。最后,使用matches()方法来判断字符串是否与正则表达式匹配。如果匹配成功,返回true,否则返回false。以下是一个示例代码: ```java import java.util.regex.Matcher; import java.util.regex.Pattern; public class RegexMatches { public static void main(String\[\] args) { String str = "v.12-xx.1"; String patternStr = "^\[v\]\[0-9\].*$"; Pattern pattern = Pattern.compile(patternStr); Matcher matcher = pattern.matcher(str); if (matcher.matches()) { System.out.println("字符串包含特定字符串"); } else { System.out.println("字符串包含特定字符串"); } } } ``` 在上述代码,我们使用正则表达式"^\[v\]\[0-9\].*$"来匹配字符串"v.12-xx.1"。如果字符串包含以"v"开头,后面跟着一个数字的字符串,则匹配成功。输结果为"字符串包含特定字符串"。如果要匹配其他特定的字符串,只需要修改正则表达式即可。 #### 引用[.reference_title] - *1* *3* [Java实现通过正则表达式判断一个字符串是否含有指定字符](https://blog.csdn.net/weixin_41979002/article/details/119597380)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [JAVA-正则表达式匹配教程 使用正则表达式匹配字符串 & 截取匹配到的字符串](https://blog.csdn.net/weixin_44436677/article/details/127543526)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值