[LeetCode 周赛184] 3. HTML 实体解析器(字符串替换、坑点注意、常规解法)

1. 题目来源

链接:1410. HTML 实体解析器

2. 题目说明

在这里插入图片描述
在这里插入图片描述

3. 题目解析

方法一:字符串替换+坑点注意+常规解法

这题本来对于 javapy 选手来讲,直接库函数 replace 一行搞定了…对于 C++ 选手就老老实实的进行字符串匹配、替换吧。简单说下思路:

  • 首先利用 mapHTML 字符实体与对应字符进行一个匹配存储
  • 双重循环,首先遍历 map 中所有的字符实体,再遍历字符串 text 进行匹配查找
  • 这里匹配查找使用 string 对象的 substr 方法进行快速定位查找,匹配成功则直接用 replace 方法进行替换即可

思路很明确,几个 API 的熟练应用也是需要掌握的

但是:这个题暴露出的注意点很多很多…

  • 首先,text.size() - s + 1 字符串对象的 size() 方法返回值类型是 unsigned int 这就直接导致了运算结果为负数时判断条件的失效,是一个很易错的知识点
  • 下面的写法会导致 ">" 由于 & 的替代嵌套到下一层,导致继续替代,导致结果为 >。这显然是错误的输出,一开始竞赛时好像这个测试用例是存在的。后来经过修正了。这个需要注意,而我在这采用的方法就是给 {"&","&\t"} 增加后续的标志位,再对结果进行删除即可。但是这个方法需要标志位不能与原有效数字起冲突,这个需要注意。这是一个简单的处理方法,也正是因为它的简单,导致了其并不安全。例如:采用一般的后缀标志位如:@、# 均是无法通过测试样例的。

参见代码如下:

// 执行用时 :1992 ms, 在所有 C++ 提交中击败了100.00%的用户
// 内存消耗 :16.6 MB, 在所有 C++ 提交中击败了100.00%的用户

class Solution {
public:
    map<string,string> m={{"&quot;","\""},
                          {"&apos;","'"},
                          {"&gt;",">"},
                          {"&lt;","<"},
                          {"&frasl;","/"},
                          {"&amp;","&\t"}};

    string entityParser(string text) {
        for (auto e : m) {
            string c = e.first;
            int s = c.size();        
            int n = text.size();
            if (s > n) continue;
            // 每次替换size会变化,不能使用 n
            // text.size() - s + 1时无符号整数,负数会很大,使得判断失效
            for (int i = 0; i < (int)(text.size() - s + 1); ++i) { 
                if (c == text.substr(i, s)) {
                    text = text.replace(i, s, e.second);
                } 
                
            }
        }
        text.erase(remove(text.begin(), text.end(), '\t'), text.end());
        return text;
    }
};
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ypuyu

如果帮助到你,可以请作者喝水~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值