由正则引起的 Wecenter 拒绝服务漏洞


本文讲的是 由正则引起的 Wecenter 拒绝服务漏洞一年前在前公司搭建了一个wecenter程序的社区,忽然有一天发现社区打开首页都会超时,后面排查发现是php超时了,当时知道是文章引起的,但是手上还有其他项目在写,就没去跟,把文章删了就没去管他了。  直到前两个星期再次发现了这种问题,刚好手上也没什么事情,就抽空去跟了下代码。

漏洞形成原因:

文章内容65k个字符,字符串太大去匹配贪婪模式,导致php timeout,看看文章的字段类型.

由正则引起的 Wecenter 拒绝服务漏洞

跟下代码:

入口文件 index.php 大概23行:

AWS_APP::run();

继续跟进去 /system/aws_app.inc.php 只看关键代码 大概104行:

$handle_controller->$action_method();

/app/article/main.php  关键代码 大概36行:

public function index_action()
    {
        //...省略部分代码
        // $article_info['message'] 是文章内容
        $article_info['message'] = FORMAT::parse_attachs(nl2br(FORMAT::parse_bbcode($article_info['message'])));
        //...省略部分代码
        TPL::output('article/index');
    }

跟进去看看FORMAT::parse_bbcode 对文章内容做了什么操作:

/system/class/cls_format.inc.php 大概78行:

public static function parse_bbcode($text)
{
    if (!$text)
    {
        return false;
    }
    return self::parse_links(load_class('Services_BBCode')->parse($text));
}

感觉wecenter的版本挺乱的。

这里可以用echo rand();exit;来调试了

继续跟进去self::parse_links :

public static function parse_links($str)
    {
        $str = @preg_replace_callback('/(?<!!![](|"|'|)|>)(https?://[-a-zA-Z0-9@:;%_+.~#?&//=!]+)(?!"|'|)|>)/i', 'parse_link_callback', $str);
        if (strpos($str, 'http') === FALSE)
        {
            $str = @preg_replace_callback('/(www.[-a-zA-Z0-9@:;%_+.~#?&//=]+)/i', 'parse_link_callback', $str);
        }
        // 经过调试发现 问题在这一行。传入的$str的字节大概6w左右,这里用到了贪婪模式 - - 这个地方的已经修复了:https://github.com/wecenter/wecenter/commit/177a9e8bab6aec8725f258df02f8f214e5b2469c
        $str = @preg_replace('/([a-z0-9+_-]+[.]?[a-z0-9+_-]+@[a-z0-9-]+.+[a-z]{2,6}+(.+[a-z]{2,6})?)/is', '<a href="mailto:1">1</a>', $str);
        echo rand();exit;
        return $str;
    }

把 preg_replace 里面的正则暂时改成w,发现还是php还是存在timeout,继续跟代码。

再回到 /app/article/main.php 的 index_action 函数的最后一行 TPL::output('article/index'); 

/system/class/cls_template.inc.php 下的 output 函数,大概56行:

$display_template_filename = 'default/' . $template_filename;
/*省略部分代码*/
$output = self::$view->getOutput($display_template_filename);

看看 self::$view 怎么来的:

/system/class/cls_template.inc.php 下的 initialize 函数:

public static function initialize()
    {
        if (!is_object(self::$view))
        {
            self::$template_path = realpath(ROOT_PATH . 'views/');
            self::$view = new Savant3(
                array(
                    'template_path' => array(self::$template_path),
                    //'filters' => array('Savant3_Filter_trimwhitespace', 'filter')
                )
            );
            if (file_exists(AWS_PATH . 'config.inc.php') AND class_exists('AWS_APP', false))
            {
                self::$in_app = true;
            }
        }
        return self::$view;
}

跟进去 self::$view->getOutput 看看$output的值是什么

/system/Savant3.php 大概1004行:

public function getOutput($tpl = null)
    {
        $output = $this->fetch($tpl);
        if ($this->isError($output)) {
            $text = $this->__config['error_text'];
            return $this->escape($text);
        } else {
            return $output;
        }
    }

$this->fetch  能看到他include了模板,并且把内容return了出去

 public function fetch($tpl = null)
    {
       
        // 省略部分代码      
        } else {
            // yes.  execute the template script.  move the script-path
            // out of the local scope, then clean up the local scope to
            // avoid variable name conflicts.
            $this->__config['fetch'] = $result;
            unset($result);
            unset($tpl);
            // are we doing extraction?
            if ($this->__config['extract']) {
                // pull variables into the local scope.
                extract(get_object_vars($this), EXTR_REFS);
            }
            // buffer output so we can return it instead of displaying.
            ob_start();
            // are we using filters?
            if ($this->__config['filters']) {
                // use a second buffer to apply filters. we used to set
                // the ob_start() filter callback, but that would
                // silence errors in the filters. Hendy Irawan provided
                // the next three lines as a "verbose" fix.
                ob_start();
                include $this->__config['fetch'];
                echo $this->applyFilters(ob_get_clean());
            } else {
                // no filters being used.
                include $this->__config['fetch'];
            }
            // reset the fetch script value, get the buffer, and return.
            $this->__config['fetch'] = null;
            return ob_get_clean();
        }
    }

继续看拿到模板内容后他是怎么处理的:

在这里耽误了很久,一开始直接echo rand();exit;调试的,没注意看有多个模板:

调试代码改成:
if($display_template_filename == 'default/article/index.tpl.htm'){
     echo rand();
     exit;
}

/system/class/cls_template.inc.php 下的 output 函数,大概 134行:

//两个贪婪模式的正则,改一下就ok了。
$output = preg_replace('/[a-zA-Z0-9]+_?[a-zA-Z0-9]*-__/', '', $output);
$output = preg_replace('/(__)?[a-zA-Z0-9]+_?[a-zA-Z0-9]*-(['|"])/', '2', $output);
if($display_template_filename == 'default/article/index.tpl.htm'){
    echo rand();
    exit;
}

刚开始真没想到贪婪模式,正则现在差不多就记得点星问了,后来跟@L3m0n(柠檬) 叔叔在做题的时候提了一下,他说是贪婪模式,复习下正则吧…

为什么贪婪模式会导致php timeout?

参考:

正则表达式的三种模式【贪婪、勉强、侵占】的分析

正则基础之——NFA引擎匹配原理

正则基础之——贪婪与非贪婪模式

<进阶-1> 正则表达式的匹配原理

*贪婪模式图

由正则引起的 Wecenter 拒绝服务漏洞

由正则引起的 Wecenter 拒绝服务漏洞

抽出上面的其中一条正则来说:

[a-zA-Z0-9]+_?[a-zA-Z0-9]*-__

把正则切割成几部分:

由正则引起的 Wecenter 拒绝服务漏洞

认真看贪婪模式的那张图片,假如传入的字符串是:

[img]abc

把字符串切割一下:

由正则引起的 Wecenter 拒绝服务漏洞

正则在线debug:https://regex101.com

正则匹配过程如下(当然我说的也不一样是对,有兴趣的可以自己去看看正则表达式的匹配原理):

第一次匹配:从字符串位置0开始,子表达式"[a-zA-Z0-9]+",匹配"[",匹配失败,继续往前匹配;

第二次匹配:从字符串位置1开始,子表达式"[a-zA-Z0-9]+",匹配"i", 匹配成功,因为是贪婪模式,一直匹配到"g"那个地方才结束;

第三次匹配:从字符串位置4开始,子表达式"_?",匹配"]",同时记录备选状态,匹配失败,此时进行回溯,找到备选状态,"_?"忽略匹配;

第四次匹配:从字符串位置4开始,子表达式"[a-zA-Z0-9]*",匹配"]",同时记录备选状态,匹配失败,此时进行回溯,找到备选状态,"_?"忽略匹配;

第五次匹配:从字符串位置4开始,子表达式"-",匹配"]",匹配失败,向前查找可供回溯的状态,把控制权交给"_?",由前面匹配成功的子表达式让出已匹配的字符"g";

第六次匹配:从字符串位置3开始,子表达式"_?",匹配"g",同时记录备选状态,匹配失败,此时进行回溯,找到备选状态,"_?"忽略匹配;

第七次匹配:从字符串位置3开始,子表达式"[a-zA-Z0-9]*",匹配"g", 匹配成功;

第八次匹配:从字符串位置4开始,子表达式"-",匹配"]",匹配失败,向前查找可供回溯的状态,把控制权交给"_?",由前面匹配成功的子表达式让出已匹配的字符"mg";

第九次匹配:从字符串位置2开始,子表达式"_?",匹配"m",匹配零次或者一次,不存在这个字符,匹配零次;

第十次匹配:从字符串位置2开始,子表达式"[a-zA-Z0-9]*",匹配"m",匹配成功,因为是贪婪模式,一直匹配到"g"那个地方才结束;

第十一次匹配:从字符串位置4开始,子表达式"-",匹配"]",匹配失败,当前位置正则已经尝试了所有可能,现在从新开始匹配,之前是从i开始匹配成功的,下面从m开始匹配。

第十二次匹配:从字符串位置2开始,子表达式"[a-zA-Z0-9]+",匹配"m",匹配成功,因为是贪婪模式,一直匹配到"g"那个地方才结束;

会一直这样循环直到正则尝试过所有的位置都不能找到匹配结果才会匹配失败。

为什么会timeout?

正则是重复的子表达式且贪婪模式组成不能正确匹配,字符串是超大的话,就会尝试匹配很多次很多次很多次,这就导致了php timeout了。

由正则引起的 Wecenter 拒绝服务漏洞

拒绝服务效果:

由正则引起的 Wecenter 拒绝服务漏洞

修复后:

由正则引起的 Wecenter 拒绝服务漏洞

修复方案:

/system/class/cls_template.inc.php 下的 output 函数,大概 134-135 行(正则)修改为如下:

$output = preg_replace('/[a-zA-Z0-9_?]+-__/', '', $output);
$output = preg_replace('/(__)?[a-zA-Z0-9_?]+-(['|"])/', '2', $output);

如何避免这种问题:

    1.子表达式不要重复并且都贪婪模式;

    2.写完正则之后debug一下;




原文发布时间为:2017年8月25日
本文作者:Mosuan_
本文来自云栖社区合作伙伴嘶吼,了解相关信息可以关注嘶吼网站。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
WeCenter(原Anwsion) 社会化问答系统 v3.3.0 更新日志   短信功能基础模块添加(三种短信通道可供选择)   支付功能基础模块添加(支付宝、微信、余额) 删除改为逻辑删除(文章/问题/用户) 内容审核增加了对文章评论问题评论和回答评论的审核 后台菜单改为数据库储存和维护 新增插件管理(后续可支持插件的安装与卸载,结合应用市场) **配合手机注册插件可实现手机号注册登录 修改加入收藏的逻辑 修复了分享导致内容脚本被执行的漏洞 升级程序修改 (支持官方版本的跨版本升级,修复了升级过程中出错而无法再升级问题) 后台增加了对违规用户IP的封禁 社区反映问题修改   WeCenter(原Anwsion) 社会化问答系统简介 Wecenter(微中心系统软件)是一款由深圳市微客互动有限公司开发的具有完全自主知识产权的开源软件。它安全,可靠,快速更迭,可以迅速帮助企业和组织通过微信,微薄,APP,网页社区等交互模式建立和客户之间的互动联系,积累知识要点,降低同质化内容的咨询成本和人力服务成本。让内容可以协同编辑,可以评价,可以快递分类和定位,建立符合企业和组织需求的结构化知识库。 通过微信公众帐号的对接,Wecenter利用结构化知识库和自然语言的检索,让企业拥有一个专业化的智能交流服务(类似苹果siri),建立一个微信端的crm系统。通过微薄的帐号管理,可以及时的了解微薄数据流中提到的关键信息,帮助企业和组织快速反映并提交解决方案。通过APP和网页社区,企业和组织可以和用户进行社交互动,并通过邀请,赞同,感谢等动作,发现优秀的人才和观点。 Wecenter是通过积累来源于微信,微薄,APP,社区等用户的碎片信息,利用社交互动的模式,分析数据,提炼数据,最终帮助企业和组织积累符合他们需求的知识百科!  WeCenter(原Anwsion) 社会化问答系统前台页面  WeCenter(原Anwsion) 社会化问答系统后台管理 后台路径:域名//?/admin/ 用户名与密码:admin admin123(安装时可设置) 后台页面: 相关阅读 同类推荐:站长常用源码
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值