1. 背景:去除content中的url,但非 img 中的链接
regex = “(?<!'|\")(?:http://|ftp://|https://|www\\.)[\\w\\-_]+(?:\\.[\\w\\-_]+)+(?:[\\w\\-\\.,@?^=%&:/~\\+#]*[\\w\\-\\@?^=%&/~\\+#])?”;
content = content.replaceAll(regex, "");
用http 前的 "|' 来区分,当然最好能去除'src=" http' 可能存在的空格, 为了确保只去除url,前面使用(?<!'|\") 模式匹配
2. 推荐一个比较全面的正则指导:http://www.oschina.net/question/12_9507