html转换成AST

目录

前言

前段时间,面试了一家公司,面试官抛来一个题目:

输入:  let str ="<div><span>tests</span></div>"
输出 : {
  tag: 'div',
  children: [
    {
      tag: 'span'
    },
  ],
}

下意识想到这个要考我html转ast,当时一下有点懵,没写出来,结束后,好好整理了一下如何去写,直接上码:

上码

      // 设置每个节点标签属性
     // let attrRE = /\s([^'"/\s><]+?)[\s/>]|([^\s=]+)=\s?(".*?"|'.*?')/g;
      function parseTag(tag) {
        let res = {
          type: "tag",
          name: "",
          voidElement: false,
          attrs: {},
          children: [],
        };
        let tagMatch = tag.match(/<\/?([^\s]+?)[/\s>]/);
        if (tagMatch) {
          // 标签名称为正则匹配的第2项
          res.name = tagMatch[1];
          if (tag.charAt(tag.length - 2) === "/") {
            // 判断tag字符串倒数第二项是不是 / 设置为空标签。 例子:<img/>
            res.voidElement = true;
          }
        }
        // 匹配所有的标签正则
        let classList = tag.match(/\s([^'"/\s><]+?)\s*?=\s*?(".*?"|'.*?')/g);

        if (classList && classList.length) {
          for (let i = 0; i < classList.length; i++) {
            // 去空格再以= 分隔字符串  得到['属性名称','属性值']
            let c = classList[i].replace(/\s*/g, "").split("=");
            // 循环设置属性
            if (c[1]) res.attrs[c[0]] = c[1].substring(1, c[1].length - 1);
          }
        }
        return res;
      }

      function parse(html) {
        let result = [];
        let current;
        let level = -1;
        let arr = [];
        let tagRE = /<[a-zA-Z\-\!\/](?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])*>/g;

        html.replace(tagRE, function (tag, index) {
          // 判断第二个字符是不是'/'来判断是否open
          let isOpen = tag.charAt(1) !== "/";
          // 获取标签末尾的索引
          let start = index + tag.length;
          // 标签之前的文本信息
          let text = html.slice(start, html.indexOf("<", start));

          let parent;
          if (isOpen) {
            level++;
            // 设置标签属性
            current = parseTag(tag);
            // 判断是否为文本信息,是就push一个text children  不等于'  '
            if (!current.voidElement && text.trim()) {
              current.children.push({
                type: "text",
                content: text,
              });
            }
            // 如果我们是根用户,则推送新的基本节点
            if (level === 0) {
              result.push(current);
            }
            // 判断有没有上层,有就push当前标签
            parent = arr[level - 1];
            if (parent) {
              parent.children.push(current);
            }
            arr[level] = current;
          }
          // 如果不是开标签,或者是空元素:</div><img>
          if (!isOpen || current.voidElement) {
            // level--
            level--;
          }
        });
        return result;
      }
      // test str:
      let html = `
                  <div class = 'divClass' style='backgroud:url(./src/asset/img.jpg)' type='c'>
                    朱文本
                    <span>文本1</span>  
                    <p class='names'>
                      文本2
                      <div>
                        <span class="span"></span>
                      </div>
                      <img/>
                    </p>
                  </div>
                `;

      let ast = parse(html);
      console.log(ast);

参考链接:
RegExp正则表达式

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值