我最近做一个简单的app,用HttpURLConnection解析网络返回的值,得到的原始数据格式如下:
为了过滤HTML的标签,达到只显示中文的目的,可以在程序中用正则表达式过滤得到的字符串。
将html的标签全部过滤的正则表达式如下:
private static final String REGEX_HTML = "<[^>]+>";
这个正则表达式的意思是匹配这样的一个子串:
(1)开始和结束的符号分别为"<"和">";
(2) 表达式"<[^>]+>"里面的"+"表示匹配前面的子表达式一次或多次;