1.StringUtils(org.apache.commons.lang3.StringUtils;)
有效的判断字符串null,空值问题(
StringUtils.isBlank(null) = true
StringUtils.isBlank("") = true
StringUtils.isBlank(" ") = true
StringUtils.isBlank("bob") = false
StringUtils.isBlank(" bob ") = false
)
2.http和https的url 自动提取 不需要正则表达式去匹配(URI)
public static String getUrl(String uris) {
URI uri;
try {
uri = new URI(uris);
} catch (URISyntaxException e) {
log.error(e.getMessage(), e);
throw new IllegalArgumentException("ERROR URL is " + uris, e);
}
URI effectiveURI = null;
try {
effectiveURI = new URI(uri.getScheme(), uri.getUserInfo(), uri.getHost(), uri.getPort(), null, null, null);
} catch (Throwable var4) {
effectiveURI = null;
}
return effectiveURI.toString();
}
3.url转码服务器识别(URLencode和URLEncoder)
URLencode将字符串转换为服务器识别的加密形式,
URLEncoder将服务器加密解析的字符串解析为初始值。
4.筛选html中的文档内容(提取html内容)
org.jsoup.Jsoup.clean(ls, new Whitelist())