POJ_3820_XML

/*
依次检查输入的字符。
1、若遇到字符“&”,则检查是否为“<”、“>”、”&”或“&xHEX;”。
   若是则继续后面的字符检查,若不是则跳出检查并输出invalid。
2、若遇到字符“<”,则检查是否为<tag><tag/></tag>三种情况之一。
   若是<tag>则入栈,若是<tag/>则跳过,若是</tag>则与栈顶比较,相同则出栈,不同则invalid。
3、若遇到单独字符“>”,则invalid。
4、若不是以上情况,则检查是否为合法字符。
*/

#include<iostream>
#include<stack>
#include<string>
#include<string.h>
using namespace std;

bool if_valid_char(char ch) {
	return 32 <= ch && ch <= 127;
}

bool if_hex_char(char ch) {
	return ('0' <= ch && ch <= '9') || ('a' <= ch && ch <= 'f') || ('A' <= ch && ch <= 'F');
}

bool if_tag_char(char ch) {
	return ('0' <= ch && ch <= '9') || ('a' <= ch && ch <= 'z');
}

#define BUF_SIZE 100000
char buf[BUF_SIZE];
int length, lt_gt;
bool valid;
stack<string> tags;

int main() {
	while (cin.getline(buf, BUF_SIZE)) {
		length = strlen(buf);
		lt_gt = 0;
		valid = true;

		int i = 0;
		while (i < length) {

			if (buf[i] == '&') {//&开头的文本是否合法
				i++;
				if (buf[i] == 'l' && buf[i + 1] == 't' && buf[i + 2] == ';') i += 3;//检查<
				else if (buf[i] == 'g' && buf[i + 1] == 't' && buf[i + 2] == ';') i += 3;//检查>
				else if (buf[i] == 'a' && buf[i + 1] == 'm' && buf[i + 2] == 'p' && buf[i + 3] == ';') i += 4;//检查&
				else if (buf[i] == 'x') {//检查十六进制数
					i++;
					if (!if_hex_char(buf[i]) || !if_hex_char(buf[i + 1])) {
						valid = false;
						break;
					}
					i += 2;
					while (true) {
						if (buf[i] == ';') {
							break;
						}
						else if (if_hex_char(buf[i]) && if_hex_char(buf[i + 1])) {
							i += 2;
						}
						else {
							valid = false;
							break;
						}
					}
					if (!valid) break;
				}
				else {
					valid = false;
					break;
				}
			}

			else if (buf[i] == '>') {//单独出现>的情况
				valid = false;
				break;
			}

			else if (buf[i] == '<') {//检查<tag><tag/></tag>
				i++;
				if (buf[i] == '/') {//</tag>的情况
					i++;
					if (buf[i] == '>') {
						i++;
					}
					else {
						if (tags.empty()) {
							valid = false;
							break;
						}
						string temp = tags.top();
						tags.pop();
						int t_length = temp.length();
						for (int j = 0; j < t_length; j++) {
							if (temp[j] != buf[i++]) {
								valid = false;
								break;
							}
						}
						if (buf[i++] != '>') valid = false;
						if (!valid) break;
					}
				}
				else {//<tan><tag/>的情况
					int pos = i;
					while (true) {
						if (buf[i] == '/') {
							i++;
							if (buf[i] == '>') {
								i++;
								break;
							}
							else {
								valid = false;
								break;
							}
						}
						else if (buf[i] == '>') {
							tags.push(string(buf + pos, buf + i));
							i++;
							break;
						}
						else  if (if_tag_char(buf[i])) {
							i++;
						}
						else {
							valid = false;
							break;
						}
					}
					if (!valid) break;
				}
			}

			else if (if_valid_char(buf[i])) {//检查是否为合法字符
				i++;
			}

			else {
				valid = false;
				break;
			}
		}

		if (!tags.empty()) valid = false;

		if (valid) cout << "valid" << endl;
		else cout << "invalid" << endl;

		while (!tags.empty()) tags.pop();
	}

	return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值