c++ 应输入表达式_java安全编码指南之:输入校验

点击上方的蓝字关注我吧

程序那些事

eb96eee822e338978e94ad238f08c05c.gif

简介

为了保证java程序的安全,任何外部用户的输入我们都认为是可能有恶意攻击意图,我们需要对所有的用户输入都进行一定程度的校验。

本文将带领大家探讨一下用户输入校验的一些场景。一起来看看吧。

在字符串标准化之后进行校验

通常我们在进行字符串校验的时候需要对一些特殊字符进行过滤,过滤之后再进行字符串的校验。

我们知道在java中字符是基于Unicode进行编码的。但是在Unicode中,同一个字符可能有不同的表示形式。所以我们需要对字符进行标准化。

java中有一个专门的类Normalizer来负责处理,字符标准化的问题。

我们看下面一个例子:

   public void testNormalizer(){        System.out.println(Normalizer.normalize("\u00C1", Normalizer.Form.NFKC));        System.out.println(Normalizer.normalize("\u0041\u0301", Normalizer.Form.NFKC));    }

输出结果:

ÁÁ

我们可以看到,虽然两者的Unicode不一样,但是最终表示的字符是一样的。所以我们在进行字符验证的时候,一定要先进行normalize处理。

考虑下面的例子:

   public void falseNormalize(){        String s = "\uFE64" + "script" + "\uFE65";        Pattern pattern = Pattern.compile("[<>]"); // 检查是否有尖括号        Matcher matcher = pattern.matcher(s);        if (matcher.find()) {            throw new IllegalStateException();        }        s = Normalizer.normalize(s, Normalizer.Form.NFKC);    }

其中\uFE64表示的是,程序的本意是判断输入的字符串是否包含了尖括号,但是因为直接传入的是unicode字符,所以直接compile是检测不到的。

我们需要对代码进行下面的改动:

   public void trueNormalize(){        String s = "\uFE64" + "script" + "\uFE65";        s = Normalizer.normalize(s, Normalizer.Form.NFKC);        Pattern pattern = Pattern.compile("[<>]"); // 检查是否有尖括号        Matcher matcher = pattern.matcher(s);        if (matcher.find()) {            throw new IllegalStateException();        }    }

先进行normalize操作,然后再进行字符验证。

注意不可信字符串的格式化

我们经常会使用到格式化来对字符串进行格式化,在格式化的时候如果格式化字符串里面带有用户输入信息,那么我们就要注意了。

看下面的例子:

   public void wrongFormat(){        Calendar c = new GregorianCalendar(2020, GregorianCalendar.JULY, 27);        String input=" %1$tm";        System.out.format(input + " 时间不匹配,应该是某个月的第 %1$terd 天", c);    }

粗看一下没什么问题,但是我们的input中包含了格式化信息,最后输出结果:

07 时间不匹配,应该是某个月的第 27rd 天

变相的,我们获取到了系统内部的信息,在某些情况下面,可能会暴露系统的内部逻辑。

上面的例子我们应该将input也作为一个参数,如下所示:

   public void rightFormat(){        Calendar c = new GregorianCalendar(2020, GregorianCalendar.JULY, 27);        String input=" %1$tm";        System.out.format("%s 时间不匹配,应该是某个月的第 %terd 天",input, c);    }

输出结果:

%1$tm 时间不匹配,应该是某个月的第 27rd 天

小心使用Runtime.exec()

我们知道Runtime.exec()使用来调用系统命令的,如果有恶意的用户调用了“rm -rf /”,一切的一切都完蛋了。

所以,我们在调用Runtime.exec()的时候,一定要小心注意检测用户的输入。

看下面的一个例子:

   public void wrongExec() throws IOException {        String dir = System.getProperty("dir");        Runtime rt = Runtime.getRuntime();        Process proc = rt.exec(new String[] {"sh", "-c", "ls " + dir});    }

上面的例子中,我们从系统属性中读取dir,然后执行了系统的ls命令来查看dir中的内容。

如果有恶意用户给dir赋值成:

/usr & rm -rf /

那么系统实际上执行的命令就是:

sh -c 'ls /usr & rm -rf /'

从而导致恶意的删除。

解决上面的问题也有几个方法,第一个方法就是对输入做个校验,比如我们只运行dir包含特定的字符:

   public void correctExec1() throws IOException {        String dir = System.getProperty("dir");        if (!Pattern.matches("[0-9A-Za-z@.]+", dir)) {            // Handle error        }        Runtime rt = Runtime.getRuntime();        Process proc = rt.exec(new String[] {"sh", "-c", "ls " + dir});    }

第二种方法就是使用switch语句,限定特定的输入:

   public void correctExec2(){        String dir = System.getProperty("dir");        switch (dir){            case "/usr":                System.out.println("/usr");                break;            case "/local":                System.out.println("/local");                break;            default:                break;        }    }

还有一种就是不使用Runtime.exec()方法,而是使用java自带的方法。

正则表达式的匹配

在正则表达式的构建过程中,如果使用用户自定义输入,同样的也需要进行输入校验。

考虑下面的正则表达式:

(.*? +public\[\d+\] +.*<SEARCHTEXT>.*)

上面的表达式本意是想在public[1234]这样的日志信息中,搜索用户的输入。

但是用户实际上可以输入下面的信息:

.*)|(.*

最终导致正则表达式变成下面的样子:

(.*? +public\[\d+\] +.*.*)|(.*.*)

从而导致匹配所有的日志信息。

解决方法也有两个,一个是使用白名单,判断用户的输入。一个是使用Pattern.quote()来对恶意字符进行转义。

更多精彩内容

1

java安全编码指南之:堆污染Heap pollution

2

JDK15真的来了!

3

一文解开java中字符串编码的小秘密

a05d3bbc92c4a8de323553d02d588b5f.png

作者小F,金融科技从业多年,懂技术又懂金融,主攻Java和区块链方向,篇篇都是用心之作,笔耕不辍,持续更新!

微信号 : 程序那些事

● 扫码关注我吧

喜欢本篇文章?帮忙点个「在看」再走吧

f0dd83abb63769c84decd6eaeca09e97.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值