java匹配出某单词除外,Java实现正则匹配出script标签中字符串包含某个几个单词的所有行,以及编码转换...

/*取得script下面的JS变量*/

Elements scriptinfo = document.getElementsByTag("script").eq(21);

List list=new ArrayList();

Map PopWindowInfo = new LinkedHashMap();

/*循环遍历script下面的JS变量*/

for (Element script : scriptinfo) {

Pattern p=Pattern.compile("((impression|more_desc|address|phone:)"+".+?)(\",)");

Pattern p2=Pattern.compile("((ticket_info|bestvisittime|besttime|open_time_desc)"+".+?);");

String sss=script.data().toString();

//            new JsonPathSelector("$..title").select(page.getRawText());

System.out.println(sss);

Matcher m = p.matcher(sss);//与字符串匹配

String arrq=null;

while(m.find()){

if(m.group(1).split(":\"").length>1){

arrq= m.group(1).split(":\"")[1];

}else{

arrq="";

}

PopWindowInfo.put(m.group(1).split(":\"")[0], convert(arrq));

// System.out.println(m.group(1).split(":\"")[0]+":"+new String(arrq.getBytes("ISO8859-1"), "GBK"));

System.out.println(m.group(1).split(":\"")[0]+":"+ convert(arrq));

}

Matcher m2 = p2.matcher(sss);//与字符串匹配

String arrqq=null;

String [] stt = null;

while(m2.find()){

String st="\',\\{text:\"";

if(m2.group(1).split(st).length>1){

//                     System.out.println(m2.group(1).split(st)[1]);

stt= m2.group(1).split(st)[1].split("\"}\\)");

if(stt.length !=0){

arrqq =stt[0];

}else{

arrqq="";

}

PopWindowInfo.put(m2.group(1).split(st)[0],convert(arrqq));

//                System.out.println(m.group(1).split(":\"")[0]+":"+new String(arrq.getBytes("ISO8859-1"), "GBK"));

System.out.println(m2.group(1).split(st)[0]+":"+convert(arrqq));

}

}

}

public static String convert(String utfString){              StringBuilder sb = new StringBuilder();              int i = -1;              int pos = 0;                            while((i=utfString.indexOf("\\u", pos)) != -1){                  sb.append(utfString.substring(pos, i));                  if(i+5 < utfString.length()){                      pos = i+6;                      sb.append((char)Integer.parseInt(utfString.substring(i+2, i+6), 16));                  }              }                            return sb.toString();           }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值