leetcode 每日一题 2023年11月23日 HTML实体解析器

本文介绍了一种HTML实体解析器,用于将HTML中的特殊字符实体如"、'等转换为实际字符。提供了两种实现方法,包括直接替换和使用Map存储字符映射。通过示例展示了如何处理可能的新字符实体问题。
摘要由CSDN通过智能技术生成

1410. HTML 实体解析器

「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。

HTML 里这些特殊字符和它们对应的字符实体包括:

双引号:字符实体为 " ,对应的字符是 " 。
单引号:字符实体为 ' ,对应的字符是 ' 。
与符号:字符实体为 & ,对应对的字符是 & 。
大于号:字符实体为 > ,对应的字符是 > 。
小于号:字符实体为 &lt; ,对应的字符是 < 。
斜线号:字符实体为 &frasl; ,对应的字符是 / 。

给你输入字符串 text ,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。

示例 1:

输入:text = "&amp; is an HTML entity but &ambassador; is not."
输出:"& is an HTML entity but &ambassador; is not."
解释:解析器把字符实体 &amp; 用 & 替换

示例 2:

输入:text = "and I quote: &quot;...&quot;"
输出:"and I quote: \"...\""

示例 3:

输入:text = "Stay home! Practice on Leetcode :)"
输出:"Stay home! Practice on Leetcode :)"

分析:字符串替换,直接找到对应字串进行替换即可。

题解1:需要注意的是&amp;会形成新的&与后面的字符串,形成新的可替换字符,例如"&amp;gt;"

public String entityParser(String text){
        text = text.replace("&quot;", "\"");
        text= text.replace("&apos;", "'");
        text = text.replace("&gt;", ">");
        text = text.replace("&lt;", "<");
        text = text.replace("&frasl;", "/");
        text = text.replace("&amp;", "&");
        //可能会形成新的&xx所以样放在最后排除
        //eg: "&amp;gt;"
        return text;
    }

题解2: 一般的字符串比较

public String entityParser(String text) {
        Map<String,Character> stringCharacterMap = new HashMap<>();
        stringCharacterMap.put("&quot;",'\"');
        stringCharacterMap.put("&apos;",'\'');
        stringCharacterMap.put("&amp;",'&');
        stringCharacterMap.put("&gt;",'>');
        stringCharacterMap.put("&lt;",'<');
        stringCharacterMap.put("&frasl;",'/');
        char[] chars = text.toCharArray();
        int len =  chars.length;

        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < len; i++) {
            sb.append(chars[i]);
            if(chars[i]=='&'){
                StringBuilder sb1 = new StringBuilder();
                for (int j = i; j < i+7&&j<len; j++) {
                    //+7是因为最长的字符(&frasl;)长度是 7
                    sb1.append(chars[j]);
                    if(stringCharacterMap.containsKey(sb1.toString())){
                        //找到了代表'&'开始的字符全部会被替换
                        sb.replace(sb.length()-1,sb.length(),"");
                        sb.append(stringCharacterMap.get(sb1.toString()));
                        i = j;
                        break;
                    }
                }
            }
        }
        return sb.toString();
    }

学习交流加群:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值