1410.HTML实体解析器

最新推荐文章于 2024-07-11 10:51:42 发布

xiaohaier2020

最新推荐文章于 2024-07-11 10:51:42 发布

阅读量34

点赞数

文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/weixin_47424736/article/details/134582379

版权

「HTML 实体解析器」是一种特殊的解析器，它将 HTML 代码作为输入，并用字符本身替换掉所有这些特殊的字符实体。

HTML 里这些特殊字符和它们对应的字符实体包括：

双引号：字符实体为 " ，对应的字符是 " 。
单引号：字符实体为 ' ，对应的字符是 ' 。
与符号：字符实体为 & ，对应对的字符是 & 。
大于号：字符实体为 > ，对应的字符是 > 。
小于号：字符实体为 < ，对应的字符是 < 。
斜线号：字符实体为 &frasl; ，对应的字符是 / 。

给你输入字符串 text ，请你实现一个 HTML 实体解析器，返回解析器解析后的结果。

示例 1：

输入：text = "&amp; is an HTML entity but &ambassador; is not."
输出："& is an HTML entity but &ambassador; is not."
解释：解析器把字符实体 &amp; 用 & 替换

示例 2：

输入：text = "and I quote: &quot;...&quot;"
输出："and I quote: \"...\""

示例 3：

输入：text = "Stay home! Practice on Leetcode :)"
输出："Stay home! Practice on Leetcode :)"

示例 4：

输入：text = "x &gt; y &amp;&amp; x &lt; y is always false"
输出："x > y && x < y is always false"

示例 5：

输入：text = "leetcode.com&frasl;problemset&frasl;all"
输出："leetcode.com/problemset/all"

提示：

1 <= text.length <= 10^5
字符串可能包含 256 个ASCII 字符中的任意字符。

题解

class Solution(object):
    def entityParser(self, text):
        """
        :type text: str
        :rtype: str
        """
        start, end, res_l = 0, len(text),[]
        text_r = {'&quot;': '"', '&apos;': '\'', '&amp;': '&', '&gt;': '>', '&lt;': '<', '&frasl;': '/'}
        while start < end:
            if (j := text.find(';',start,end) +1 ) == 0 or (i := text.rfind('&', start,j)) == -1:
                res_l.append(text[start:])
                break
            res_l.append(text[start:i])
            res_l.append(text_r[s] if (s:= text[i:j])) in text_r else s)
            start = j
        return ''.join(res_l)

一个有意思的答案：

rfind()和find()函数

rfind() 返回字符串最后一次出现的索引，如果没有匹配项则返回-1
find() 返回字符串第一次出现的索引，如果没有匹配项则返回-1

句法：

str_super.rfind(substr, start,end)
substr：想要查找的字符串
start：开始查找的索引，并且包含此索引
end：结束查找的索引，并且不包含此索引
str_super：想要查找substr的字符串

:=海象操作符，用于在表达式中同时进行赋值和判断。

xiaohaier2020

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1410.HTML实体解析器

HTML 实体解析器」是一种特殊的解析器，它将 HTML 代码作为输入，并用字符本身替换掉所有这些特殊的字符实体。⁄给你输入字符串text，请你实现一个 HTML 实体解析器，返回解析器解析后的结果。is not."is not."解析器把字符实体 & 用 & 替换"Stay home!
复制链接

扫一扫