我需要从服务器响应数据中删除一些内容。
使用我得到的正则表达式提取器
Działalność lecznicza.
从那我只需要:“Działalnośćlecznicza”
所以我用Beanshell编写了一个程序,应该这样做,因为我得到了一个问题
“ lecznicza lecznicza”
这是我的程序:
import java.util.regex;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
String pattern = "\\w+(?=\\
String co = vars.get("tresc");
int len = Integer.parseInt(vars.get("length"));
String phrase="";
StringBuffer sb = new StringBuffer();
Pattern r = Pattern.compile(pattern);
Matcher m = r.matcher(co);
for(i=0; i < len ;i++){
if (m.find()){
strbuf = new StringBuffer(m.group(0));
}
else {
phrase="notfound";
}
sb.append(" ");
sb.append(strbuf);
}
phrase = sb.toString();
return phrase;
tresc-是我提取模式词的来源。长度-告诉我我要提取多少个单词。
程序可以很好地处理不带民族字符的短语。这就是为什么我认为编码或此处存在某些问题:
Pattern r = Pattern.compile(pattern);
Matcher m = r.matcher(co);
但我不知道如何更改我的代码。