手把手教你防御 XSS 攻击

最新推荐文章于 2024-07-23 12:00:00 发布

小贤编程手记

最新推荐文章于 2024-07-23 12:00:00 发布

阅读量663

点赞数

文章标签： xss 前端安全

原文链接：https://juejin.cn/post/7177015789382271035

版权

攻击分类

XSS 攻击主要可以分为三类

存储型（持久型）（server端缺陷）
反射型（server 端缺陷）
DOM 型(浏览器端缺陷）

接下来将从上面的攻击类型分别给出防御方案

反射型

为什么叫 ta 反射型，大概是因为

由于需要用户主动打开恶意的 URL 才能生效，攻击者往往会结合多种手段诱导用户点击。

而像上面这个是一个搜索的例子，用户需要点击下面这个链接

http://localhost:3000/search?search=<script>alert("反射型 XSS 攻击")</script>

这个反射型 XSS 攻击之所以能够成功的原因是后端未对用户提交的内容做校验，具体逻辑如下

/**
 * 基于用户搜索内容返回 /search 页面内容
 * @param {string} search 
 */
exports.generateSearchHTML = (search = "") => {
  return `
    <body>
      <form
        action="http://localhost:3000/search"
        method="GET"
        enctype="application/json"
      >
        搜索：<input class="search-input" name="search" type="text" />
        <br />
        搜索内容：${search}
        <br />
        <button class="confirm-button" type="submit">确认</button>
      </form>
    </body>
  `;
};
复制代码

此类后端渲染直接拼接返回 HTML 字符串是主要原因，所以防御的主要手段就是对可能的恶意代码片段进行转义

啥是转义呢？为什么不直接把可能是恶意代码删掉就行了呢？

比如 <script>alert("反射型 XSS 攻击")</script> 里的 < > / 这几个字符，我删掉就行了

这样操作其实不太严谨，毕竟不是所有和 < > / 相关的内容都是恶意的，就比如我数学不好，我去搜索 5 < 7 的答案是多少，很合理吧？

所以过滤和删除是不行的，所以就要采用转义

转义（Escape）

有一些特别的字符被保留用于 HTML 中，这意味着浏览器会将这些字符解析为 HTML 代码。例如，如果你使用小于号（<），浏览器会将其后的文本解析为一个 tag。

即 HTML 有一些特殊字符，就比如 < > / 这种字符，如果你想要在浏览器展示，想要 HTML 能够正常渲染，可以采用浏览器提供的实体（Entity）

比如说

<span>123&amp;</span>
复制代码

实际效果就是 123&

这个转义的意思和正则表达式的转义应该是差不多的

下面这个是文章使用到的转义字符的对照表

字符	十进制	转义字符
"	`"`	`"`
&	`&`	`&`
<	`<`	`<`
`>`		`>`
不断开空格(non-breaking space)	` `	` `

更详细的对照表请参考下面的两个表

HTML转义字符常用对照表 - OSCHINA
字符实体的官方列表 - 这个格式乱乱的，建议看上面这个

防御实操

回到反射型 XSS 攻击的防御，可以在 Server 端采用转义的方式解决，代码如下

// ...
exports.generateSearchHTML = (search = "") => {
  /**
   * 转义字符串
   * @param {string} originStr
   * @returns
   */
  const escape = (originStr) => {
    let str = originStr;
    str = str.replace(/</g, "&lt;");
    str = str.replace(/>/g, "&gt;");
    str = str.replace(/"/g, "&quot;");
    str = str.replace(/'/g, "&#x27;");
    str = str.replace(/\//g, "&#x2F;");
    return str;
  };

  return `
    ...
        搜索内容：${search}
    ...
  `;
};
复制代码

我的正则应该还是非常 66666 的

效果如下

直接将攻击者的恶意代码渲染，并且不会执行，看看这次生成的 HTML

<body>
  <form
    action="http://localhost:3000/v2/search"
    method="GET"
    enctype="application/json"
  >
    搜索：<input class="search-input" name="search" type="text" />
    <br />
    搜索内容：&lt;script&gt;alert(&quot;反射型 XSS
    攻击&quot;)&lt;&#x2F;script&gt;
    <br />
    <button class="confirm-button" type="submit">确认</button>
  </form>
</body>
复制代码

特殊字符都被转义了，恶意代码不会被执行