java safe base64_Java下奇怪的Base64

开言

下面这一段代码中会报错。

1

2

3

4

5

6

7

8

9

10

11import org.springframework.util.Base64Utils;

import sun.misc.BASE64Encoder;

public class Test{

public static void main(String[] args){

byte[] content = "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa".getBytes();

String encrypted = new BASE64Encoder().encode(content);

byte[] decrypted = Base64Utils.decodeFromString(encrypted);

System.out.println(new String(decrypted));

}

}

6ac9d7053c99ae0caf150178c0f18199.png

接下来我们分别查看一些这两个代码,我们发现BASE64Encoder().encode在进行base64编码的时候进行了换行,换行符的ascii编码对应的是0x0a,所以刚好命中这个报错。

0ae154959ba90e186de5bc5385121e16.png

sun.misc.BASE64Decoder

代码实现如下,进行分别拆解。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException{

int var4 = 0;

PushbackInputStream var5 = new PushbackInputStream(var1);

this.decodeBufferPrefix(var5, var2);

while(true) {

try {

int var6 = this.decodeLinePrefix(var5, var2);

int var3;

for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {

this.decodeAtom(var5, var2, this.bytesPerAtom());

var4 += this.bytesPerAtom();

}

if (var3 + this.bytesPerAtom() == var6) {

this.decodeAtom(var5, var2, this.bytesPerAtom());

var4 += this.bytesPerAtom();

} else {

this.decodeAtom(var5, var2, var6 - var3);

var4 += var6 - var3;

}

this.decodeLineSuffix(var5, var2);

} catch (CEStreamExhausted var8) {

this.decodeBufferSuffix(var5, var2);

return;

}

}

}

首先 decodeLinePrefix 返回的是 bytesPerLine 定义的长度72。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException{

int var4 = 0;

PushbackInputStream var5 = new PushbackInputStream(var1);

this.decodeBufferPrefix(var5, var2);

while(true) {

try {

int var6 = this.decodeLinePrefix(var5, var2);

protected int decodeLinePrefix(PushbackInputStream var1, OutputStream var2) throws IOException{

return this.bytesPerLine();

}

protected int bytesPerLine(){

return 72;

}

紧接着调用 decodeAtom 进行处理,其中 bytesPerAtom 定义的数值是4。

1

2

3

4

5

6

7

8

9int var3;

for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {

this.decodeAtom(var5, var2, this.bytesPerAtom());

var4 += this.bytesPerAtom();

}

protected int bytesPerAtom(){

return 4;

}

我们看看 decodeAtom 进行处理,先看看 readFully 方法。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18protected void decodeAtom(PushbackInputStream var1, OutputStream var2, int var3) throws IOException{

byte var5 = -1;

byte var6 = -1;

byte var7 = -1;

byte var8 = -1;

if (var3 < 2) {

throw new CEFormatException("BASE64Decoder: Not enough bytes for an atom.");

} else {

int var4;

do {

var4 = var1.read();

if (var4 == -1) {

throw new CEStreamExhausted();

}

} while(var4 == 10 || var4 == 13);

this.decode_buffer[0] = (byte)var4;

var4 = this.readFully(var1, this.decode_buffer, 1, var3 - 1);

在 readFully 当中,4个字节为一个单位组合,经过处理之后,结果是[89,87,70,104]。

189,87,70,104,61

接着会继续循环,那我们知道,这玩意吗会按照4个字节为一个list去处理,前四个数据处理完之后,接下来的list是[61,,,],也就是说在readFully循环处理的过程中,返回结果是-1

dddf8deff0ec8ac90771742140ae969b.png

当返回结果是-1的时候会进入 CEStreamExhausted 进行处理。

1

2if (var4 == -1) {

throw new CEStreamExhausted();

处理经过返回null,也就是说在这个异常里面是不会报错退出的。

那我们继续看看,假设我们把后面字节补齐,变成

189,87,70,104,61,61,61,61

可以看到经过处理之后变成[61,61,61,61]

d693baf68c4afac432fa9b133f59004e.png

0x61 在ascii编码里面代表 = ,进入到case 2进行处理。

189,87,70,104,61,61,61,61

94c8c2d2d5fd7f6f485898d13400de33.png

a3ebbb18f5b62a5d8a6640b912a42d27.png

实际可以看到 decode 处理数据是[97,97,97,-1]

b6f061dcef6f476526f45d275bb0fb0b.png

java.util.base64.decode

我们在看看java.util.base64.decode这个decode词法解析器,在这里面会进行两种base64判断。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28private int decode0(byte[] src, int sp, int sl, byte[] dst){

int[] base64 = isURL ? fromBase64URL : fromBase64;

int dp = 0;

int bits = 0;

int shiftto = 18; // pos of first byte of 4-byte atom

while (sp < sl) {

int b = src[sp++] & 0xff;

if ((b = base64[b]) < 0) {

if (b == -2) { // padding byte '='

// = shiftto==18 unnecessary padding

// x= shiftto==12 a dangling single x

// x to be handled together with non-padding case

// xx= shiftto==6&&sp==sl missing last =

// xx=y shiftto==6 last is not =

if (shiftto == 6 && (sp == sl || src[sp++] != '=') ||

shiftto == 18) {

throw new IllegalArgumentException(

"Input byte array has wrong 4-byte ending unit");

}

break;

}

if (isMIME) // skip if for rfc2045

continue;

else

throw new IllegalArgumentException(

"Illegal base64 character " +

Integer.toString(src[sp - 1], 16));

}

一种是判断YWFh=中最后的=,也就是说[89,87,70,104,61]这个list经过运算之后如果是=,就会进行下面判断,不符合规则就会报错Input byte array has wrong 4-byte ending unit。

e5a23accf3c0d40cffbbd2da87031296.png

而下面 isMIME 判断是来自Decoder.RFC4648,默认是 false 。

1

2

3

4

5

6

7

8

9public static byte[] decode(byte[] src) {

return src.length == 0 ? src : Base64.getDecoder().decode(src);

}

public static Decoder getDecoder(){

return Decoder.RFC4648;

}

static final Decoder RFC4648 = new Decoder(false, false);

static final Decoder RFC4648_URLSAFE = new Decoder(true, false);

static final Decoder RFC2045 = new Decoder(false, true);

结语

简单做个总结,也就是说用sun.misc.BASE64Decoder这个方法做base64解码的时候,针对base64的兼容性更高,你在base64的字符串后面无论加多少个=都没关系,但是在例如java.util.base64.decode这类型严格按照base64规范的进行解码的方法下,就会出现报错。

那有啥用呢,比如在一些base64编码环境下,可能检测用的是java.util.base64.decode方法,实际后面业务解码用的是sun.misc.BASE64Decoder这样在前后不一致的情况下,会出现绕过的问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值