编码学习之Base64

Base64编码方式简介

我们直接用文本编辑器去打开pdf,exe等,肯定会看到很多乱码,因为并不是所有的二进制字符都可以打印出来。

为了能够打印出来所有的二进制数据,就用到了Base64编码。

Base64编码中,以每6个bit为一个单元,所以一共可以取64个值,对应64个可打印字符。这样3个Byte就相当于24bit,对应4个Base64单元。

例如编码Man,转化为Base64的编码就是

文本Man
ASCII编码7797110
二进制位010011010110000101101110
索引1922546
Base64编码TWF

u

 

 

 

 

 

 

所以Man经过Base64编码之后就是TWFu。

Base64的索引表如下

索引01234567891011121314151617181920212223
字符

A

BCDEFGHIJKLMNOPQRSTUVWX
索引242526272829303132333435363738394041424344454647
字符YZabcdefghijklmnopqrstuv
索引48495051525354555657585960616263        
字符wxyz0123456789+/        

 

 

 

 

 

 

补位

从Base64的介绍可以看出,是每3个字符被编码成4个Base64个字符,那如果原始长度不能被3整除怎么办,那就补位,使用0字节在末尾补足,使其能够被3整除。在编码后的Base64为本后加上一个或者两个=号,代表补足的字节数。

如A经过编码只有就是QQ==,BC编码之后就是QkM=

Base64 变种

  • For Mime:在MIME格式的电子邮件中,Base64可以用来将binary的字节序列数据编码成ASCII字符序列构成的文本。Mime Base64规定每行不超过76字符,超过后,自动使用\r\n进行分割
  • For Url: URL Base64编码可用来在HTTP环境下传递较长的标识信息。然后,标准的Base64并不适合直接放在URL中传输,因为URL编码器会把标准的Base64中的/和+字符编程%xx的形式,而这些%号在存入数据库时还需要进行转换,因为ANSI SQL已经将%作为通配符。为了解决这个问题,可以采用一种用于URL的Base64编码,它不将原始Base64中的+/替换成了-

Java\kotlin中的使用

代码如下

class LxcTest {
    @Test
    fun base64() {
        val source = "abcdefcaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa你好🙆🙆🙆【♦⑸±"
        println(source)
        val after = Base64.getEncoder().encode(source.toByteArray())
        println(String(after))
        println(Base64.getEncoder().encodeToString(source.toByteArray()))
        println(Base64.getMimeEncoder().encodeToString(source.toByteArray()))
        println(Base64.getUrlEncoder().encodeToString(source.toByteArray()))
    }
}

打印结果如下

abcdefcaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa你好🙆🙆🙆【♦⑸±
YWJjZGVmY2FhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWHkvaDlpb3wn5mG8J+ZhvCfmYbjgJDimabikbjCsQ==
YWJjZGVmY2FhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWHkvaDlpb3wn5mG8J+ZhvCfmYbjgJDimabikbjCsQ==
YWJjZGVmY2FhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFh
YWFhYWFhYWFhYWHkvaDlpb3wn5mG8J+ZhvCfmYbjgJDimabikbjCsQ==
YWJjZGVmY2FhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWHkvaDlpb3wn5mG8J-ZhvCfmYbjgJDimabikbjCsQ==

手撸一下编码

代码如下

package com.plbear.lxc.utils

import kotlin.experimental.and

/**
 * Base64加密算法
 * Created by yanyongjun on 1/28/21
 */
object Base64 {
    private val encodeArray = charArrayOf(
        'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
        'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'
    )

    fun Byte.toMyInt(): Int {
        return if (this > 0) this.toInt() else ((0b0111_1111).toByte() and this).toInt() + 0b1000_0000
    }

    fun encodeByBase64(source: ByteArray): String {
        if (source.isEmpty()) return ""
        val groupCnt = source.size / 3
        val otherCnt = source.size % 3

        val result = StringBuilder()
        for (i in 0 until groupCnt) {
            val a = source[i * 3].toMyInt()
            val b = source[i * 3 + 1].toMyInt()
            val c = source[i * 3 + 2].toMyInt()
            val index1 = a ushr 2
            val index2 = ((a and 0b11) shl 4) or (b ushr 4)
            val index3 = ((b and 0b1111) shl 2) or (c ushr 6)
            val index4 = c and 0b11_1111
            result.append(encodeArray[index1])
            result.append(encodeArray[index2])
            result.append(encodeArray[index3])
            result.append(encodeArray[index4])
        }

        if (otherCnt == 1) {
            val a = source[groupCnt * 3].toMyInt()
            result.append(encodeArray[a ushr 2])
            result.append(encodeArray[(a and 0b11) shl 4])
            result.append("==")
        } else if (otherCnt == 2) {
            val a = source[groupCnt * 3].toMyInt()
            val b = source[groupCnt * 3 + 1].toMyInt()
            result.append(encodeArray[a ushr 2])
            result.append(encodeArray[((a and 0b11) shl 4) or (b ushr 4)])
            result.append(encodeArray[((b and 0b1111 shl 2))])
            result.append("=")
        }
        return result.toString()
    }
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Base64编码是一种将二进制数据转换为ASCII字符的编码方式,它将原始数据按照固定的规则转换成一串字符。由于Base64编码使用了64个字符来表示64个不同的值,因此编码后的数据大小会比原始数据稍微大一些。 具体到图片的情况,使用Base64编码将图片转换成字符串后,其大小会比原始图片的大小大约增加1/3左右。这是因为Base64编码后的字符串中会包含一些额外的字符,用来表示原始数据的编码格式。 需要注意的是,大图片转换成Base64编码后的字符串会非常长,可能会导致数据传输的效率降低。因此,在实际应用中,如果需要传输大图片,建议直接传输图片的URL或者使用其他方式进行传输,而不是将图片转换成Base64编码字符串传输。 参考资料: 之前一直有用过对图片进行base64编码,然后将base64编码后的串放在请求体中传输,由于http本身并没有对请求体的大小进行限制,因此也并未对图片的大小以及编码后的base64串大小进行过研究。因为目前我们的技术架构方面,前端直接访问网关层,由于网关层对body体进行了大小限制,因此我需要了解图片和base64编码之间的大小关系。 :https://c.runoob.com/front-end/59这个工具蛮好用的,大图片就用它转base64。 :主要介绍了基于JavaScript获取base64图片大小,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下。 :当把byte[]通过Convert.ToBase64String转换成Base64编码字符串时数据会明显变大,是为什么呢?我们就先探究一下什么是Base64编码?<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值