「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
双引号:字符实体为 " ,对应的字符是 " 。
单引号:字符实体为 ' ,对应的字符是 ' 。
与符号:字符实体为 & ,对应对的字符是 & 。
大于号:字符实体为 > ,对应的字符是 > 。
小于号:字符实体为 < ,对应的字符是 < 。
斜线号:字符实体为 ⁄ ,对应的字符是 / 。
给你输入字符串 text
,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。
示例 1:
输入:text = "& is an HTML entity but &ambassador; is not."
输出:"& is an HTML entity but &ambassador; is not."
解释:解析器把字符实体 & 用 & 替换
示例 2:
输入:text = "and I quote: "...""
输出:"and I quote: \"...\""
示例 3:
输入:text = "Stay home! Practice on Leetcode :)"
输出:"Stay home! Practice on Leetcode :)"
分析:字符串替换,直接找到对应字串进行替换即可。
题解1:需要注意的是&
会形成新的&与后面的字符串,形成新的可替换字符,例如"&gt;"
public String entityParser(String text){
text = text.replace(""", "\"");
text= text.replace("'", "'");
text = text.replace(">", ">");
text = text.replace("<", "<");
text = text.replace("⁄", "/");
text = text.replace("&", "&");
//可能会形成新的&xx所以样放在最后排除
//eg: "&gt;"
return text;
}
题解2: 一般的字符串比较
public String entityParser(String text) {
Map<String,Character> stringCharacterMap = new HashMap<>();
stringCharacterMap.put(""",'\"');
stringCharacterMap.put("'",'\'');
stringCharacterMap.put("&",'&');
stringCharacterMap.put(">",'>');
stringCharacterMap.put("<",'<');
stringCharacterMap.put("⁄",'/');
char[] chars = text.toCharArray();
int len = chars.length;
StringBuilder sb = new StringBuilder();
for (int i = 0; i < len; i++) {
sb.append(chars[i]);
if(chars[i]=='&'){
StringBuilder sb1 = new StringBuilder();
for (int j = i; j < i+7&&j<len; j++) {
//+7是因为最长的字符(⁄)长度是 7
sb1.append(chars[j]);
if(stringCharacterMap.containsKey(sb1.toString())){
//找到了代表'&'开始的字符全部会被替换
sb.replace(sb.length()-1,sb.length(),"");
sb.append(stringCharacterMap.get(sb1.toString()));
i = j;
break;
}
}
}
}
return sb.toString();
}
学习交流加群: