CTF 总结02:preg_match()绕过

问题描述:

曾经碰到了一道抄答案都没抄明白的题目(#_<-),卡在了不懂大佬是怎么绕过preg_match()的,所以在此总结~

博文内容:(1)官方手册介绍与留言;(2)博主们的思路实践整理~


官方介绍:

链接在此:[PHP: preg_match - Manual](https://www.php.net/manual/zh/function.preg-
match.php “PHP: preg_match - Manual”)

作为匹配检查的大函数,可以带五个小参数:pattern、subject、matches、flags、offset,其中前两个:pattern、subject是必须要填写的后三个不填写的话会有自动的默认值

pattern: 需要被检查的字符串(通常就是我们传到网页的字符串)~

subject: 需要被比较的字符串(通常就是被WAF拉黑的字符串)~

matches: 搜索结果,$matches[0]将包含完整模式匹配到的文本, $matches[1]
将包含第一个捕获子组匹配到的文本,以此类推默认为null

flags:
有以下几种返回值可选——preg_offset_capture(匹配成功时返回字符串的起始位置)、preg_offset_capture(不设置时,匹配失败无返回值;设置时,匹配失败会返回Null)默认为0

offset: 指定检查字符串时的开始位置默认为0

preg_match()这个函数,如果pattern匹配到指定subject,则返回 1;如果没有匹配到则返回 0,
或者在失败时返回false~(也可能返回等同于false的非布尔值)

官方介绍中还有一些范例说明,值得摘要一下~

(1)模式分隔符后写i,表示这是一个大小写不敏感的搜索,例 **“/ php/i”**可匹配PHP~

(2)模式中的\b标记单词边界,表示只会完全匹配,而不会匹配某单词的部分内容,例 **“/
\bweb\b/i”**只会匹配web的大小写形式,而不能匹配cobweb(单词中含有web)~

(3)捕获截断功能,例如:

**preg_match( ‘@(?:http://)?([/]+)@i’,“http://www.php.net/index.html”,
$matches);**这句话的输出结果是www.php.net,是捕获了http://之后,/之前的内容~

^ 表示匹配输入字符串的开始位置~

(?😃 表示匹配但是不记住项,例如(?http://)捕获不含http://本身的字符串开始的位置~

[^/] 表示不匹配/以及之后的内容~

+ 表示多次匹配,否则只会输入单个字符w~

i 表示匹配不区分大小写~

** preg_match(‘/[.]+\.[.]+$/’, “www.php.net”,
$matches);**这句话的输出结果是php.net是截取了第一个.的所有内容,同时保留了第二个.后到行尾的内容

$ 表示匹配输入字符串的结尾位置~

————————————————————————————————————

对于正则表达式有兴趣可以参考下面的三个网页,反正我自己看到那些鬼画符真的很头大~

参考1:[php正则表达式中preg_match函数的详解-PHP中文网](https://www.php.cn/php-
weizijiaocheng-381228.html “php正则表达式中preg_match函数的详解-PHP中文网”)

参考2:[正则表达式 – 语法 | 菜鸟教程 (runoob.com)](https://www.runoob.com/regexp/regexp-
syntax.html “正则表达式 – 语法 | 菜鸟教程 (runoob.com)”)

参考3:[正则表达式 - JavaScript | MDN
(mozilla.org)](https://developer.mozilla.org/zh-
CN/docs/Web/JavaScript/Guide/Regular_Expressions “正则表达式 - JavaScript | MDN
(mozilla.org)”)

如果想做到简单的截断功能, strstr() 也真的可以考虑一下~


↑图片内容摘自:PHP: strstr - Manual

————————————————————————————————————

(4)命名子组,这个貌似是把数组的值赋予属性吧~在ctf中我还暂时没有看到过这种用法…

↑图片内容摘自:[PHP: preg_match -
Manual](https://www.php.net/manual/zh/function.preg-match.php "PHP: preg_match

  • Manual")

————————————————————————————————————

类似的功能,数组在创建的过程中,用 array() 函数本身就可以实现命名…

↑图片内容摘自:[PHP: Array 数组 -
Manual](https://www.php.net/manual/zh/language.types.array.php "PHP: Array 数组

  • Manual")

以上就是官方的介绍内容,下面整理一下大佬们的绕过方式~


绕过整理:

参考1:preg_match()绕过的问题总结 - 无据 - 博客园
(cnblogs.com)

参考2:preg_match函数绕过 | 码农网
(codercto.com)

推荐preg_match()的绕过:PHP preg_系列漏洞小结 | 国光
(sqlsec.com)

以下绕过我都是直接贴到编辑器里运行的,菜鸟教程在线编辑器
(runoob.com)
~

首先我们贴一个最最简单的代码,要求输入flag.php,黑名单是flag~

<?php
$a='flag.php'; //目标是输入flag.php
if(!preg_match("/flag/",$a)==false){ //如果匹配中出现了flag
	die('这样子是不行的~'); //绕过失败,输出:这样子是不行的~
}
echo '成功啦~'; //绕过成功
?>

运行一下试试结果,可以看出来直接被判定失败了~

1 数组绕过

代码的第二行更换参数,把传入的代码从字符串形式改为数组形式,通常是以下三种形式~

$a[]='flag.php';

$a=array('flag.php');

$a=['flag.php'];

(注意以下第三行 a = [ ′ f l a g . p h p ′ ] ; ,粗心的小白不要像我一样写成 a=['flag.php'];,粗心的小白不要像我一样写成 a=[flag.php];,粗心的小白不要像我一样写成a=‘[flag.php]’;这样,会被判定成字符串的,导致绕过失败的…)

执行结果如下图所示,绕过成功啦~

2 回溯次数绕过(我失败啦)

preg_match()的回溯次数可以设定,默认是1000000次(中英文次数不同,实测回溯为100w次,5.3.7版本以前是10w次),这个可以在php.ini中查询~

↑图片内容摘自:[PHP: 运行时配置 -
Manual](https://www.php.net/manual/zh/pcre.configuration.php#ini.pcre.backtrack-
limit “PHP: 运行时配置 - Manual”)

↓如果对php.ini的其他内容感兴趣,可以参考这个:PHP: php.ini 配置选项列表 -
Manual
,虽然与本博文的关系不大,不过对于其他的ctf题目会很有帮助的~

所以我们这里可以采用函数str_repeat(),强行输入一个字符串好多好多次~~

首先,我们把1输入100w次,看看分别有什么效果~

$a=str_repeat('1',1000000);

可以看到,这个运行结果是一片白茫茫,没有输出失败判定,说明成功啦~不过准确来说,以上内容只能使preg_match()挂掉,严格来说不算绕过…

我还没想到什么其他的利用方法…比如说后面加一个flag.php,就被当场抓包了…以下是我的失败案例一览…而且从运行速度上推断,我怀疑他只是检查了’1‘和’flag.php’两个变量,没有执行回溯,这个小机灵鬼~

$a=str_repeat('1',1000000).'flag.php';//失败示范1,flag被抓包~

$a=str_repeat('flag.php',1000000);//失败示范2,flag被抓包~

$a='flag.php'*1000000;//不知道是不是失败,echo该变量的结果是0,也就是php不认识这个东西...相当于输入一个0~

3 换行符绕过(我失败啦)

怀疑这是一种存在于传说中的匹配方法…我这边怎么测试都是不好使…

$a="\nflag.php\n";//失败范例1~

$a="%0aflag.php%0a";//失败范例2~


emm…暂时写到这里,后续我再想想…一定会有其他绕过方法的,遇到题目我会再补充的~

4 preg_match_all()绕过

preg_match() 函数在第一次匹配后将会停止搜索,但 preg_match_all()
函数会一直匹配到结尾,就很适合多行命令的执行~

针对正则表达式,看看通过没有被禁掉的字符,有希望达到多行命令执行的效果~

相关题目:Web安全攻防世界04
unseping(江苏工匠杯)

暂时就想到这些,话说这篇已经是修正一次的结果了,以后还是会根据做题经历有所增补的~

博文写得模糊或者有误之处,欢迎留言讨论与批评~

码字不易,若有所帮助,可以点赞支持一下博主嘛?感谢~(●’◡’●)

接下来我将给各位同学划分一张学习计划表!

学习计划

那么问题又来了,作为萌新小白,我应该先学什么,再学什么?
既然你都问的这么直白了,我就告诉你,零基础应该从什么开始学起:

阶段一:初级网络安全工程师

接下来我将给大家安排一个为期1个月的网络安全初级计划,当你学完后,你基本可以从事一份网络安全相关的工作,比如渗透测试、Web渗透、安全服务、安全分析等岗位;其中,如果你等保模块学的好,还可以从事等保工程师。

综合薪资区间6k~15k

1、网络安全理论知识(2天)
①了解行业相关背景,前景,确定发展方向。
②学习网络安全相关法律法规。
③网络安全运营的概念。
④等保简介、等保规定、流程和规范。(非常重要)

2、渗透测试基础(1周)
①渗透测试的流程、分类、标准
②信息收集技术:主动/被动信息搜集、Nmap工具、Google Hacking
③漏洞扫描、漏洞利用、原理,利用方法、工具(MSF)、绕过IDS和反病毒侦察
④主机攻防演练:MS17-010、MS08-067、MS10-046、MS12-20等

3、操作系统基础(1周)
①Windows系统常见功能和命令
②Kali Linux系统常见功能和命令
③操作系统安全(系统入侵排查/系统加固基础)

4、计算机网络基础(1周)
①计算机网络基础、协议和架构
②网络通信原理、OSI模型、数据转发流程
③常见协议解析(HTTP、TCP/IP、ARP等)
④网络攻击技术与网络安全防御技术
⑤Web漏洞原理与防御:主动/被动攻击、DDOS攻击、CVE漏洞复现

5、数据库基础操作(2天)
①数据库基础
②SQL语言基础
③数据库安全加固

6、Web渗透(1周)
①HTML、CSS和JavaScript简介
②OWASP Top10
③Web漏洞扫描工具
④Web渗透工具:Nmap、BurpSuite、SQLMap、其他(菜刀、漏扫等)

那么,到此为止,已经耗时1个月左右。你已经成功成为了一名“脚本小子”。那么你还想接着往下探索吗?

阶段二:中级or高级网络安全工程师(看自己能力)

综合薪资区间15k~30k

7、脚本编程学习(4周)
在网络安全领域。是否具备编程能力是“脚本小子”和真正网络安全工程师的本质区别。在实际的渗透测试过程中,面对复杂多变的网络环境,当常用工具不能满足实际需求的时候,往往需要对现有工具进行扩展,或者编写符合我们要求的工具、自动化脚本,这个时候就需要具备一定的编程能力。在分秒必争的CTF竞赛中,想要高效地使用自制的脚本工具来实现各种目的,更是需要拥有编程能力。

零基础入门的同学,我建议选择脚本语言Python/PHP/Go/Java中的一种,对常用库进行编程学习
搭建开发环境和选择IDE,PHP环境推荐Wamp和XAMPP,IDE强烈推荐Sublime;

Python编程学习,学习内容包含:语法、正则、文件、 网络、多线程等常用库,推荐《Python核心编程》,没必要看完

用Python编写漏洞的exp,然后写一个简单的网络爬虫

PHP基本语法学习并书写一个简单的博客系统

熟悉MVC架构,并试着学习一个PHP框架或者Python框架 (可选)

了解Bootstrap的布局或者CSS。

阶段三:顶级网络安全工程师

如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!

学习资料分享

当然,只给予计划不给予学习资料的行为无异于耍流氓,这里给大家整理了一份【282G】的网络安全工程师从入门到精通的学习资料包,可点击下方二维码链接领取哦。

# 学习计划安排

我一共划分了六个阶段,但并不是说你得学完全部才能上手工作,对于一些初级岗位,学到第三四个阶段就足矣~

这里我整合并且整理成了一份【282G】的网络安全从零基础入门到进阶资料包,需要的小伙伴可以扫描下方CSDN官方合作二维码免费领取哦,无偿分享!!!

如果你对网络安全入门感兴趣,那么你需要的话可以

点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!

①网络安全学习路线
②上百份渗透测试电子书
③安全攻防357页笔记
④50份安全攻防面试指南
⑤安全红队渗透工具包
⑥HW护网行动经验总结
⑦100个漏洞实战案例
⑧安全大厂内部视频资源
⑨历年CTF夺旗赛题解析

  • 8
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
preg_match函数是PHP中用于执行正则表达式匹配的函数。在CTF比赛中,可能会遇到一些安全控制中使用了正则表达式检查输入的情况。为了绕过这种检查,可以尝试以下方法: 1. 绕过正则表达式匹配的特殊字符:在正则表达式中,有一些特殊字符如$、^、*、+等,如果直接输入这些字符,很可能会被正则表达式匹配函数检测出来。可以使用反斜杠\对这些特殊字符进行转义,绕过检测。例如,要匹配字符串$abc,可以使用正则表达式/\$abc/。 2. 绕过正则表达式中使用的黑名单:有时候,安全控制会设置一个正则表达式的黑名单,例如禁止出现' or ''='等关键词。可以使用一些技巧来绕过这种检测,例如使用大小写混合、使用空格、使用HTML实体等。例如,要匹配字符串' or ''=',可以使用正则表达式/'[\s]*oR[\s]*'='[\s]*'/i,其中[\s]*表示0个或多个空格,i表示大小写不敏感。 3. 利用正则表达式的漏洞:有时候,正则表达式本身可能存在一些漏洞,可以利用这些漏洞来绕过安全控制。例如,正则表达式中的量词可能会导致性能问题,可以尝试使用非贪婪量词来绕过匹配。例如,要匹配字符串abc,可以使用正则表达式/a.*?c/,其中.*?表示非贪婪匹配任意字符。 4. 绕过正则表达式的限制:有时候,正则表达式的长度限制或者复杂度限制可能会导致无法匹配某些字符串。可以尝试使用一些技巧来绕过这种限制,例如将正则表达式拆分成多个部分、使用递归匹配等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值