c html 解析器,C ++中的HTML实体解析器

假设我们有一个字符串;我们必须设计一个HTML解析器,它将HTML语法的特殊字符替换为普通字符。HTML实体解析器是将HTML代码作为输入并将特殊字符的所有实体替换为字符本身的解析器。这些是HTML的特殊字符及其实体-引号-实体为“,符号字符为”。

单引号-实体为',符号字符为'。

&符-实体为&,符号字符为&。

大于符号-实体为>,符号字符为>。

小于符号-实体为

斜线-实体为⁄,符号字符为/。

因此,如果输入就像“&已更改,但&ambassador;未更改。”,则输出将为“&已更改但&ambassador;未更改”。

为了解决这个问题,我们将遵循以下步骤-定义数组v =通过使用空格分割字符串来初始化v

ret:=空字符串

定义一个映射m,它将所有HTML符号作为键,并将相应的特殊字符作为值

对于初始化i:= 0,当i

ret:= ret串联温度

ret:= ret连接m [temp]如果v [i,k]与'&'相同,则-

除此以外

ret:= ret +温度ret:= ret + m [temp]

温度:=温度+ v [i,k]

(将k增加1)温度:=温度+ v [i,k]

(将k增加1)

而(k

温度:=温度+ v [i,k]

(将k增加1)

如果temp是m的成员,则-

除此以外

temp:=空字符串

ret:= ret + v [i,k]

(将k增加1)s:= v [i]

temp:=空字符串

n:= v [i]的大小

k:= 0

当k

如果temp的大小不为0并且temp是m的成员,则-

否则,当temp大小时,则-

如果我不等于v的大小,则-

返回ret

让我们看下面的实现以更好地理解-#include 

using namespace std;

class Solution {

public:

vector  split(string& s, char delimiter){

vector  tokens;

string token;

istringstream tokenStream(s);

while(getline(tokenStream, token, delimiter)){

tokens.push_back(token);

}

return tokens;

}

void out(vector  v){

for(string s : v) cout <

}

string entityParser(string text) {

vector v = split(text, ' ');

string ret = "";

map m;

m["""] = "\"";

m["'"] = "\'";

m["&"] = "&";

m[">"] = ">";

m["

m["⁄"] = "/";

for (int i = 0; i 

string s = v[i];

string temp = "";

int n = v[i].size();

int k = 0;

while (k 

if (v[i][k] == '&') {

temp += v[i][k];

k++;

while (k 

temp += v[i][k];

k++;

}

temp += v[i][k];

k++;

if (m.count(temp))

ret += m[temp];

else

ret += temp;

temp = "";

}

else {

ret += v[i][k];

k++;

}

}

if (temp.size() && m.count(temp)) {

ret += m[temp];

}

else if (temp.size())

ret += temp;

if (i != v.size() - 1)

ret += " ";

}

return ret;

}

};

main(){

Solution ob;

cout <

}

输入值"& is changed but &ambassador; is not."

输出结果& is changed but &ambassador; is not.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值