复现20字符短域名绕过以及xss相关知识点
1、HTML实体编码
一个HTML解析器作为一个状态机,他从输入流中获取字符并且按照转换规则转换到另一种状态。
在解析的过程中会经过4个状态
2、字符实体
字符实体是一个转义序列,他定义了一班无法在文本内容中输入的单个字符或符号。一个字符实体是以&开始,后面跟着一个预定义的实体名称,或者是一个#以及字符的十进制数字。
3、HTML字符实体编码
在HTML中,默写字符是预留的,比如说html中不可以使用“<”和“>”;因为浏览器可能会误认他们是标签的开始或者结束。所以在html中应该使用对应的字符实体。在HTML实体编码中可能有一些字符是没有实体名称的,但是我们可以用实体编号来引用。
4、字符引用
字符引用包括字符值引用和字符实体引用;字符值医用对应这符号的实体编号,而字符实体引用对应的是实体名。字符实体引用也被叫做“实体引用”或者“实体”。
HTML中的五类元素
1)空元素;不能容纳任何内容(因为他们没有闭合标签,没有内容能够放在开始标签和闭合标签中间)比如说< area >,< br>,< base >等等
2)原始文本元素;原始文本元素是可以容纳文本的。有< script>,< style >
3)RCDATA元素,可以容纳文本和字符引用。有< textarea >和< title >
4)外部元素;可以痛啊文本,字符引用,CDATA段以及其他元素注