编码算法与哈希算法详解及应用

猿究院小宇

于 2023-07-10 18:51:30 发布

阅读量236

点赞数 4

文章标签：哈希算法算法

本文链接：https://blog.csdn.net/yy020125/article/details/131644123

版权

编码

最简单的编码是直接给每个字符指定一个若干字节表示的整数，复杂一点的编码就需要根据一个已有的编码推算出来。

比如UTF-8编码，它是一种不定长编码，但可以从给定字符的Unicode编码推算出来。

本文将举例Url编码以及Base64编码来对编码算法进行解析

URL编码

URL编码是浏览器发送数据给服务器时使用的编码，它通常附加在URL的参数部分，例如：

https://www.baidu.com/s?wd=%E5%93%88

%E5%93%88为URL编码，是“哈”的意思。

使用URL编码是因为出于兼容性考虑，很多服务器只识别ASCII字符。对于中文，日文，德文之类的文字无法进行编码。URL编码有这些规则：

如果字符是A~Z，a~z，0~9以及-、_、.、*，则保持不变；
如果是其他字符，先转换为UTF-8编码，然后对每个字节以%XX表示

package com.tyu.code;

import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;

public class Demo01 {
public static void main(String[] args) {
	 try {
		 //编码
		String keyword="哈基米";
		 String encodeRet=URLEncoder.encode(keyword, "utf-8");
		 System.out.println("编码:"+encodeRet);
	} catch (UnsupportedEncodingException e) {
		e.printStackTrace();
	}
	 
	 //解码
	 try {
		String decodeRet=URLDecoder.decode("%E5%93%88%E5%9F%BA%E7%B1%B3","utf-8");
		 System.out.println("解码:"+decodeRet);
	} catch (UnsupportedEncodingException e) {
		e.printStackTrace();
	}
}
}

URLEncoder用来进行编码，URLDecoder用来进行解码

URL编码的目的是把任意文本数据编码为%前缀表示的文本，便于浏览器和服务器处理；

Base64编码

URL编码是对字符进行编码，表示成%xx的形式，而Base64编码是对二进制数据进行编码，表示成文本格式。
Base64编码可以把任意长度的二进制数据变为纯文本，并且纯文本内容中且只包含指定字符内容：A~Z、a~z、0~9、+、/、=。它的原理是把3字节的二进制数据按6bit一组，用4个int整数表示，然后查表，把int整数用索引对应到字符，得到编码后的字符串。

举个例子：3个byte数据分别是e4、b8、ad，按6bit分组得到39、0b、22和2d，分别对应十进制57、11、34、45，通过索引计算结果为5Lit4。

	    //编码
        byte[]buf= {(byte) 0xe4, (byte) 0xb8, (byte) 0xad};
	    String base64encoded = Base64.getEncoder().encodeToString(buf);
	    System.out.println(base64encoded);
	    
	    //解码
	    byte[] byteArrray=Base64.getDecoder().decode("5Lit");
	    for(byte b:byteArrray) {
	    	System.out.println(Integer.toHex

最低0.47元/天解锁文章

猿究院小宇

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
编码算法与哈希算法详解及应用

它的原理是把3字节的二进制数据按6bit一组，用4个int整数表示，然后查表，把int整数用索引对应到字符，得到编码后的字符串。碰撞是一定会出现的，因为输出的字节长度是固定的，String的hashCode()输出是4字节整数，最多只有4294967296种输出，但输入的数据长度是不固定的，有无数种输入。因为相同的输入永远会得到相同的输出，因此，如果输入被修改了，得到的输出就会不同。我们只需要自己计算一下本地文件的哈希值，再与官网公开的哈希值对比，如果相同，说明文件下载正确，否则，说明文件已被篡改。
复制链接

扫一扫