代码审计思路之实例解说全文通读

根据敏感关键字来回溯传入的参数,是一种逆向追踪的思路,我们也提到了这种方式的优缺点,实际上在需要快速寻找漏洞的情况下用回溯参数的方式是非常有效的,但这种方式并不适合运用在企业中做安全运营时的场景,在企业中做自身产品的代码审计时,我们需要了解整个应用的业务逻辑,才能挖掘到更多更有价值的漏洞。

全文通读代码也有一定的技巧,并不是随便找文件一个个读完就可以了,这样你是很难真正读懂这套Web程序的,也很难理解代码的业务逻辑,首先我们要看程序的大体代码结构,如主目录有哪些文件,模块目录有哪些文件,插件目录有哪些文件,除了关注有哪些文件,还要注意文件的大小、创建时间。我们根据这些文件的命名就可以大致知道这个程序实现了哪些功能,核心文件是哪些,如下是discuz的程序主目录。如图所示。

0?wx_fmt=jpeg

在看程序目录结构的时候,我们要特别注意几个文件,分别如下:

函数集文件,通常命名中包含functions或者common等关键字,这些文件里面是一些公共的函数,提供给其他文件统一调用,所以大多数文件都会在文件头部包含到它们,寻找这些文件一个非常好用的技巧就是去打开index.php或者一些功能性文件,在头部一般都能找到。





配置文件,通常命名里面包括config这个关键字,配置文件包括Web程序运行必须的功能性配置选项以及数据库等配置信息,从这个文件里面可以了解程序的小部分功能,另外看这个文件的时候注意观察配置文件中参数值是用单引号还是用的双引号包起来,如果是双引号,则很大可能会存在代码执行漏洞,例如下面kuwebs的代码,只要我们在修改配置的时候利用PHP可变变量的特性即可执行代码。

<?php/*网站基本信息配置*/$kuWebsiteURL       = "http://www.kuwebs.com";$kuWebsiteSupportEn         = "1";$kuWebsiteSupportSimplifiedOrTraditional          = "0";$kuWebsiteDefauleIndexLanguage                    = "cn";$kuWebsiteUploadFileMax                           = "2";$kuWebsiteAllowUploadFileFormat   = "swf|rar|jpg|zip|gif"; /*邮件设置*/$kuWebsiteMailType        = "1";$kuWebsiteMailSmtpHost             = "smtp.qq.com";





安全过滤文件,安全过滤文件对我们做代码审计至关重要,关系到我们挖掘到的可疑点能不能利用,通常命名中有filter、safe、check等关键字,这类文件主要是对参数进行过滤,比较常见的是针对SQL注入和XSS过滤,还有文件路径、执行的系统命令的参数,其他的则相对少见。而目前大多数应用都会在程序的入口循环对所有参数使用addslashes()函数进行过滤。

private static function _do_query_safe($sql) {              $sql = str_replace(array('\\\\', '\\\'', '\\"', '\'\''), '', $sql);              $mark = $clean = '';              if (strpos($sql, '/') === false && strpos($sql, '#') === false && strpos($sql, '-- ') === false && strpos($sql, '@') === false && strpos($sql, '`') === false) {                     $clean = preg_replace("/'(.+?)'/s", '', $sql);              } else {





index文件,index是一个程序的入口文件,所以通常我们只要读一遍index文件就可以大致的了解整个程序的架构,运行的流程,包含到的文件,其中核心的文件又有哪些,而不同目录的index文件也有不同的实现方式,建议最好是先把几个核心目录的index文件都简单读一遍。

上面介绍了我们应该注意的部分文件,可以帮助我们更有方向的去读全部的代码,实际上在我们真正做的代码审计的时候,经常会遇到各种框架,这时候就会被搞的晕头转向,所以在学习代码审计的前期建议不要去读开源框架或者使用开源框架的应用,先去chinaz、admin5一类的源码下载网站下载一些小应用来读一下,并且一定要多找几套程序通读全文代码,这样我们才能总结经验,等总结了一定的经验,会PHP也比较熟悉的时候,再去读一些像thinkphp、Yii、Zend Framework等开源框架,才能快速的挖掘高质量的漏洞。

通读全文代码的好处显而易见,可以更好的了解程序的架构以及业务逻辑,能够挖掘到更多更高质量的逻辑漏洞,一般老手会比较喜欢这种方式。而缺点就是花费的时间比较多,如果程序比较大,读起来也会比较累。


骑士cms通读审计案例



我们已经介绍了代码审计中通读全文代码审计方式的思路,下面我们来用这种方式进行一个大致的案例说明。

为了方便大家理解,笔者找了一款相对简单容易看懂的应用骑士cms来介绍,版本是3.5.1,具体的审计思路我们在上文中已经有过介绍。


1 查看应用文件结构



首先来看一下骑士cms的大致文件目录结构,如图所示:

0?wx_fmt=jpeg

首先需要看看有哪些文件和文件夹,寻找名称里有没有带有api、admin、manage、include一类关键字的文件和文件夹,通常这些文件比较重要,在这个程序里,可以看到并没有什么php文件,就一个index.php,看到有一个名为include的文件夹,一般比较核心的文件都会放在这个文件夹,我们进行看看大概有哪些文件,如图所示:

0?wx_fmt=jpeg



2查看关键文件代码



在这个文件夹里面我们看到了多个数十K的PHP文件,比如common.fun.php就是本程序的核心文件,基础函数基本在这个文件中实现,我们来看看这个文件里有哪些关键函数,一打开这个文件,立马就看到一大堆过滤函数,这是我们最应该关心的地方,首先是一个SQL注入过滤函数。

function addslashes_deep($value){    if (empty($value))    {        return $value;    }    else    {              if (!get_magic_quotes_gpc())              {              $value=is_array($value) ? array_map('addslashes_deep', $value) : mystrip_tags(addslashes($value));              }              else              {              $value=is_array($value) ? array_map('addslashes_deep', $value) : mystrip_tags($value);              }              return $value;    }}

该函数将传入的变量使用addslashes()函数进行过滤,也就过滤掉了单引号、双引号、NULL字符以及斜杠,现在我们要记住,在挖掘SQL注入等漏洞时,只要参数在拼接到sql语句前,除非有宽字节注入或者其他特殊情况,否则使用了这个函数就不能注入了。

再往下走是一个XSS过滤的函数mystrip_tags(),代码如下:

function mystrip_tags($string){       $string = new_html_special_chars($string);       $string = remove_xss($string);       return $string;}

这个函数调用了new_html_special_chars()和remove_xss()两个函数来过滤XSS,就在该函数下方,代码如下

function new_html_special_chars($string) {       $string = str_replace(array('&amp;', '&quot;', '&lt;', '&gt;'), array('&', '"', '<', '>'), $string);       $string = strip_tags($string);       return $string;}function remove_xss($string) {    $string = preg_replace('/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F]+/S', '', $string); 
$parm1 = Array('javascript', 'union','vbscript', 'expression', 'applet', 'xml', 'blink', 'link', 'script', 'embed', 'object', 'iframe', 'frame', 'frameset', 'ilayer', 'layer', 'bgsound', 'title', 'base');
$parm2 = Array('onabort', 'onactivate', 'onafterprint', 'onafterupdate', 'onbeforeactivate', 'onbeforecopy', 'onbeforecut', 'onbeforedeactivate', 'onbeforeeditfocus', 'onbeforepaste', 'onbeforeprint', 'onbeforeunload', 'onbeforeupdate', 'onblur', 'onbounce', 'oncellchange', 'onchange', 'onclick', 'oncontextmenu', 'oncontrolselect', 'oncopy', 'oncut', 'ondataavailable', 'ondatasetchanged', 'ondatasetcomplete', 'ondblclick', 'ondeactivate', 'ondrag', 'ondragend', 'ondragenter', 'ondragleave', 'ondragover', 'ondragstart', 'ondrop', 'onerror', 'onerrorupdate', 'onfilterchange', 'onfinish', 'onfocus', 'onfocusin', 'onfocusout', 'onhelp', 'onkeydown', 'onkeypress', 'onkeyup', 'onlayoutcomplete', 'onload', 'onlosecapture', 'onmousedown', 'onmouseenter', 'onmouseleave', 'onmousemove', 'onmouseout', 'onmouseover', 'onmouseup', 'onmousewheel', 'onmove', 'onmoveend', 'onmovestart', 'onpaste', 'onpropertychange', 'onreadystatechange', 'onreset', 'onresize', 'onresizeend', 'onresizestart', 'onrowenter', 'onrowexit', 'onrowsdelete', 'onrowsinserted', 'onscroll', 'onselect', 'onselectionchange', 'onselectstart', 'onstart', 'onstop', 'onsubmit', 'onunload','style','href','action','location','background','src','poster');
$parm3= Array('alert','sleep','load_file','confirm','prompt','benchmark','select','update','insert','delete','alter','drop','truncate','script','eval');
$parm = array_merge($parm1, $parm2, $parm3);
for ($i = 0; $i < sizeof($parm); $i++) { $pattern = '/'; for ($j = 0; $j < strlen($parm[$i]); $j++) { if ($j > 0) { $pattern .= '('; $pattern .= '(&#[x|X]0([9][a][b]);?)?'; $pattern .= '|(&#0([9][10][13]);?)?'; $pattern .= ')?'; } $pattern .= $parm[$i][$j]; } $pattern .= '/i'; $string = preg_replace($pattern, '****', $string); } return $string;}

在new_html_special_chars()函数中可以看到,这个函数对&符号、双引号以及尖括号进行了html实体编码,并且使用strip_tags()函数进行了二次过滤。而remove_xss()函数则是对一些标签关键字、事件关键字以及敏感函数关键字进行了替换。

再往下走有一个获取ip地址的函数getip() 是可以伪造IP地址的。

function getip(){       if (getenv('HTTP_CLIENT_IP') and strcasecmp(getenv('HTTP_CLIENT_IP'),'unknown')) {              $onlineip=getenv('HTTP_CLIENT_IP');       }elseif (getenv('HTTP_X_FORWARDED_FOR') and strcasecmp(getenv('HTTP_X_FORWARDED_FOR'),'unknown')) {              $onlineip=getenv('HTTP_X_FORWARDED_FOR');       }elseif (getenv('REMOTE_ADDR') and strcasecmp(getenv('REMOTE_ADDR'),'unknown')) {              $onlineip=getenv('REMOTE_ADDR');       }elseif (isset($_SERVER['REMOTE_ADDR']) and $_SERVER['REMOTE_ADDR'] and strcasecmp($_SERVER['REMOTE_ADDR'],'unknown')) {              $onlineip=$_SERVER['REMOTE_ADDR'];       }       preg_match("/\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}/",$onlineip,$match);       return $onlineip = $match[0] ? $match[0] : 'unknown';}

很多应用都会在获取IP这里没有验证IP格式,导致存在注入漏洞,不过这里还只是可以伪造IP。

再往下看可以看到一个值得关注的地方,sql查询统一操作函数inserttable()以及updatetable()函数,大多数SQL语句执行都会经过这里,所以我们要关注这个地方是是否还有过滤等问题。

function inserttable($tablename, $insertsqlarr, $returnid=0, $replace = false, $silent=0) {       global $db;       $insertkeysql = $insertvaluesql = $comma = '';       foreach ($insertsqlarr as $insert_key => $insert_value) {              $insertkeysql .= $comma.'`'.$insert_key.'`';              $insertvaluesql .= $comma.'\''.$insert_value.'\'';              $comma = ', ';       }       $method = $replace?'REPLACE':'INSERT';       // echo $method." INTO $tablename ($insertkeysql) VALUES ($insertvaluesql)", $silent?'SILENT':'';die;       $state = $db->query($method." INTO $tablename ($insertkeysql) VALUES ($insertvaluesql)", $silent?'SILENT':'');       if($returnid && !$replace) {              return $db->insert_id();       }else {           return $state;       }}

再往下走则是wheresql()函数,是sql语句查询的where条件拼接的地方,我们可以看到参数都使用了单引号进行包裹起来,代码如下:

function wheresql($wherearr=''){       $wheresql="";       if (is_array($wherearr))              {              $where_set=' WHERE ';                     foreach ($wherearr as $key => $value)                     {                     $wheresql .=$where_set. $comma.$key.'="'.$value.'"';                     $comma = ' AND ';                     $where_set=' ';                     }              }       return $wheresql;}

还有一个访问令牌生成的函数asyn_userkey(),拼接用户名、密码salt以及密码进行一次md5,访问的时候只要在GET参数key的值里面加上生成的这个key即可验证是否有权限,被用在注册、找回密码等验证过程中,也就是我们能看到的找回密码链接里面的key,代码如下:

function asyn_userkey($uid){       global $db;       $sql = "select * from ".table('members')." where uid = '".intval($uid)."' LIMIT 1";       $user=$db->getone($sql);       return md5($user['username'].$user['pwd_hash'].$user['password']);}

同目录下的文件如图所示:

0?wx_fmt=jpeg

则是具体功能的实现代码,我们这时候还不需要看,先再了解下程序的其他结构。



3查看配置文件



接下里我们找找看配置文件,上面我们有介绍到配置文件的文件名通常都带有” config”这样的关键字,我们只要搜索带有这个关键字的文件名即可,如图所示:

0?wx_fmt=jpeg

在搜索结果中我们可以看到有搜索出来多个文件,结合文件所在目录这个经验可以判断出data目录下面的config.php以及cache_config.php才是真正的配置文件,打开/data/config.php看看代码,如下:

<?php
$dbhost = "localhost";$dbname = "1850pxs";$dbuser = "root";$dbpass = "123456";$pre = "qs_";$QS_cookiedomain = '';$QS_cookiepath = "/1850pxs/";$QS_pwdhash = "K0ciF:RkE4xNhu@S";define('QISHI_CHARSET','gb2312');define('QISHI_DBCHARSET','GBK');?>

很明显的可以看到这里,很有可能存在我们之前说过的双引号解析代码执行的问题,通常这个配置是在安装系统的时候设置的,或者后台也有设置的地方,另外我们还应该记住的一个点是QISHI_DBCHARSET常量,这里配置的数据库编码是GBK,也就可能存在宽字节注入,不过需要看数据库连接时设置的编码,不妨找找看,找到骑士cms连接mysql的代码在include\mysql.class.php文件的connect()函数,代码如下:

function connect($dbhost, $dbuser, $dbpw, $dbname = '', $dbcharset = 'gbk', $connect=1){       $func = empty($connect) ? 'mysql_pconnect' : 'mysql_connect';       if(!$this->linkid = @$func($dbhost, $dbuser, $dbpw, true)){              $this->dbshow('Can not connect to Mysql!');       } else {              if($this->dbversion() > '4.1'){                     mysql_query( "SET NAMES gbk");                     if($this->dbversion() > '5.0.1'){                            mysql_query("SET sql_mode = ''",$this->linkid);                            mysql_query("SET character_set_connection=".$dbcharset.", character_set_results=".$dbcharset.", character_set_client=binary", $this->linkid);                     }              }       }       if($dbname){              if(mysql_select_db($dbname, $this->linkid)===false){                     $this->dbshow("Can't select MySQL database($dbname)!");              }       }}

这段代码里面加粗部分有一个存在安全隐患的地方,代码中首先判断mysql版本是否大于4.1,如果是则执行:

mysql_query( "SET NAMES gbk");

执行这个语句之后再判断,如果大于5则执行:

mysql_query("SET character_set_connection=".$dbcharset.", haracter_set_results=".$dbcharset.", character_set_client=binary", $this->linkid);

也就是说在mysql版本小于mysql5的情况下是不会执行这行代码的,但是执行了”set names gbk”,我们在之前有介绍过”set names gbk”其实干了三件事,等同于:

SET character_set_connection=’ gbk’, haracter_set_results=’ gbk’, character_set_client=’gbk’

因此在mysql版本大于4.1小于5的情况下基本所有跟数据库有关的操作都存在宽字节注入。


4跟读首页文件



通过对系统文件大概的了解,我们对这套程序的整体架构已经有了一定的了解,但是还不够了解,所以我们得跟读一下index.php文件,看看程序运行的时候会调用哪些文件和函数。

打开首页文件index.php可以看到如下代码:

if(!file_exists(dirname(__FILE__).'/data/install.lock')) header("Location:install/index.php");define('IN_QISHI', true);$alias="QS_index";require_once(dirname(__FILE__).'/include/common.inc.php');

首先判断安装锁文件是否存在,如果不存在则跳转到install/index.php,接下里是包含/include/common.inc.php 文件,跟进该文件查看,代码如下:

require_once(QISHI_ROOT_PATH.'data/config.php');header("Content-Type:text/html;charset=".QISHI_CHARSET);require_once(QISHI_ROOT_PATH.'include/common.fun.php');require_once(QISHI_ROOT_PATH.'include/1850pxs_version.php');

/include/common.inc.php文件在开头包含了三个文件,data/config.php为数据库配置文件,include/common.fun.php文件为基础函数库文件,include/1850pxs_version.php为应用版本文件,接着往下看:

if (!empty($_GET)){$_GET  = addslashes_deep($_GET);}if (!empty($_POST)){$_POST = addslashes_deep($_POST);}$_COOKIE   = addslashes_deep($_COOKIE);$_REQUEST  = addslashes_deep($_REQUEST);

这段代码调用了include/common.fun.php文件里面的addslashes_deep() 函数对GET/POST/COOKIE参数进行了过滤,再往下走可以看到又有一个包含文件的操作:

require_once(QISHI_ROOT_PATH.'include/tpl.inc.php');

包含了include/tpl.inc.php文件,跟进看看这个文件做了什么,代码如下

include_once(QISHI_ROOT_PATH.'include/template_lite/class.template.php');$smarty = new Template_Lite;$smarty -> cache_dir = QISHI_ROOT_PATH.'temp/caches/'.$_CFG['template_dir'];$smarty -> compile_dir =  QISHI_ROOT_PATH.'temp/templates_c/'.$_CFG['template_dir'];$smarty -> template_dir = QISHI_ROOT_PATH.'templates/'.$_CFG['template_dir'];$smarty -> reserved_template_varname = "smarty";$smarty -> left_delimiter = "{#";$smarty -> right_delimiter = "#}";$smarty -> force_compile = false;$smarty -> assign('_PLUG', $_PLUG);$smarty -> assign('QISHI', $_CFG);$smarty -> assign('page_select',$page_select);

首先看到包含了include/template_lite/class.template.php文件,这是一个映射程序模板的类,由Paul Lockaby paul和Mark Dickenson编写,由于该文件较大,我们这里不在仔细分析,继续往下跟进,可以看到这段代码实例化了这个类对象赋值给$smarty变量,进行跟进则回转到index.php文件,代码如下:

if(!$smarty->is_cached($mypage['tpl'],$cached_id)){require_once(QISHI_ROOT_PATH.'include/mysql.class.php');$db = new mysql($dbhost,$dbuser,$dbpass,$dbname);unset($dbhost,$dbuser,$dbpass,$dbname);$smarty->display($mypage['tpl'],$cached_id);}else{$smarty->display($mypage['tpl'],$cached_id);}

判断是否已经缓存,然后调用display()函数输出页面,审计到这里是否对整个程序的框架比较熟悉了?接下来只要像审计index.php文件一样跟进其他功能入口文件即可完成代码通读。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。在编写C程序时,需要注意变量的声明和定义、指针的使用、内存的分配与释放等问题。C语言中常用的数据结构包括: 1. 数组:一种存储同类型数据的结构,可以进行索引访问和修改。 2. 链表:一种存储不同类型数据的结构,每个节点包含数据和指向下一个节点的指针。 3. 栈:一种后进先出(LIFO)的数据结构,可以通过压入(push)和弹出(pop)操作进行数据的存储和取出。 4. 队列:一种先进先出(FIFO)的数据结构,可以通过入队(enqueue)和出队(dequeue)操作进行数据的存储和取出。 5. 树:一种存储具有父子关系的数据结构,可以通过中序遍历、前序遍历和后序遍历等方式进行数据的访问和修改。 6. 图:一种存储具有节点和边关系的数据结构,可以通过广度优先搜索、深度优先搜索等方式进行数据的访问和修改。 这些数据结构在C语言中都有相应的实现方式,可以应用于各种不同的场景。C语言中的各种数据结构都有其优缺点,下面列举一些常见的数据结构的优缺点: 数组: 优点:访问和修改元素的速度非常快,适用于需要频繁读取和修改数据的场合。 缺点:数组的长度是固定的,不适合存储大小不固定的动态数据,另外数组在内存中是连续分配的,当数组较大时可能会导致内存碎片化。 链表: 优点:可以方便地插入和删除元素,适用于需要频繁插入和删除数据的场合。 缺点:访问和修改元素的速度相对较慢,因为需要遍历链表找到指定的节点。 栈: 优点:后进先出(LIFO)的特性使得栈在处理递归和括号匹配等问题时非常方便。 缺点:栈的空间有限,当数据量较大时可能会导致栈溢出。 队列: 优点:先进先出(FIFO)的特性使得

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值