密码学学习笔记(三)——AES的查表加速


高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法,是美国联邦政府采用的一种分组加密标准。若按算法描述进行加解密运算,就会出现计算量大、耗时长之类的问题,为解决这个问题,我们将一些复杂的过程通过查表运算代替,这样就可以通过增加存储复杂度来减少时间复杂度,从而达到在时间程度上优化算法的目的。
在AES算法中,整个加解密的过程可以归纳为字节替代(SubBytes)、行移位(ShiftRows)、列混合(MixColumns)和轮密钥加(AddRoundKey)这四种变换,如图:

在这里插入图片描述
其中,字节代替和列混合都可以通过查表的方式实现。

S盒生成

根据资料,AES的S盒的通过下式生成的:
在这里插入图片描述
而b0到b7则是原位置通过有限域GF(28)上的求逆运算得到的结果(如果想深入了解,可以学习近世代数),由于数据量较小,我们就不使用欧几里得算法求逆,而是直接利用域上逆元的定义进行求解,所以这里先定义GF(28)上的乘法运算:

word_8 mul(word_8 a,word_8 b)
{
	word_8 data[8],dat;
	data[0] = a;
	data[1] = data[0] << 1;
	if((data[0] & 0x80) == 0x80) data[1] ^= 0x1b;
	data[2] = data[1] << 1;
	if((data[1] & 0x80) == 0x80) data[2] ^= 0x1b;
	data[3] = data[2] << 1;
	if((data[2] & 0x80) == 0x80) data[3] ^= 0x1b;
	data[4] = data[3] << 1;
	if((data[3] & 0x80) == 0x80) data[4] ^= 0x1b;
	data[5] = data[4] << 1;
	if((data[4] & 0x80) == 0x80) data[5] ^= 0x1b;
	data[6] = data[5] << 1;
	if((data[5] & 0x80) == 0x80) data[6] ^= 0x1b;
	data[7] = data[6] << 1;
	if((data[6] & 0x80) == 0x80) data[7] ^= 0x1b;
	
	dat = 0x00;
	if((b & 0x01) == 0x01) dat ^= data[0];
	if((b & 0x02) == 0x02) dat ^= data[1];
	if((b & 0x04) == 0x04) dat ^= data[2];
	if((b & 0x08) == 0x08) dat ^= data[3];
	if((b & 0x10) == 0x10) dat ^= data[4];
	if((b & 0x20) == 0x20) dat ^= data[5];
	if((b & 0x40) == 0x40) dat ^= data[6];
	if((b & 0x80) == 0x80) dat ^= data[7];
	
	return dat;
}

接着就是通过遍历求逆元的运算:

word_8 tr(word_8 a)
{
	word_8 i;
	if(a == 0x00)
		return 0x00;
	else
		for(i = 0x01;i <= 0xff && i != 0x00;i++)
			if(mul(a,i) == 0x01)
				return i;
}

然后是主程序,这里我们将S盒生成到文件S.txt中:

int main()
{
	word_8 a[8] = {0xf1,0xe3,0xc7,0x8f,0x1f,0x3e,0x7c,0xf8},
			b = 0x63,x1,x,y,z,i = 0x00;
	FILE *p;
	int j,k;
	p = fopen("S.txt","wb");
	fprintf(p,"{");
	do
	{
		z = 0x00;
		x = tr(i);
		for(j = 0;j < 8;j++)
		{
			z = z >> 1;
			y = a[j] & x;
			x1 = 0x00;
			for(k = 0;k < 8;k++)
			{
				x1 ^= y & 0x80;
				y = y << 1;
			}
			z ^= x1;
		}
		z ^= b;
		fprintf(p,"0x%02x",z);
		if(i % 16 != 15)
			fprintf(p,",");
		if((i | 0xf0) == 0xff && i != 0xff)
			fprintf(p,",\n");
		i++;
	}while(i != 0x00);
	fprintf(p,"}");
	fclose(p);
	return 0;
}

这里只给出了生成正向S盒的算法,逆向S盒Un_S[]只需通过

word_8 i = 0x00;
do{
	Un_S[S[i]] = i;
}while(i != 0x00);

即可生成。

T表生成

如图,在AES中,列混合是计算复杂度最高的一个模块,矩阵中的乘法运算都是有限域GF(28)上的运算,如果能通过查表实现,那么算法的执行速度就会大大提升。
在这里插入图片描述
由于如果存一个大表的话,其所需的存储空间就会超出正常电脑的内存,所以这里我们先将如图列混合按列拆成四部分
在这里插入图片描述
可以证明,将每一个4*1的列向量左乘4*4的矩阵得到的4*1的矩阵按顺序拼接,最终得到的4*4矩阵就是所要求的矩阵,即:
在这里插入图片描述
由于这里的乘法运算只有在有限域GF(28)上任意数与01,02,03的乘法运算,所以这里我们只用建一个3*256的表进行查找即可:

void make_list()
{
	word_8 i = 0x00,j;
	do
	{
		mul_list[0][i] = i;
		j = i << 1;
		if((i & 0x80) == 0x80) j ^= 0x1b;
		mul_list[1][i] = j;
		mul_list[2][i] = i ^ j;
		i++;
	}while(i != 0x00);
}

接着我们接公式,遍历每一列的所有值,得到这一列对应的T表T1 ,T2 ,T3 ,T4 ,分别存入List_1.txt到List_4.txt中:

int main()
{
	word_8 i,j,k;
	make_list();
	FILE *p1,*p2,*p3,*p4;
	p1 = fopen("List_1.txt","wb");
	p2 = fopen("List_2.txt","wb");
	p3 = fopen("List_3.txt","wb");
	p4 = fopen("List_4.txt","wb");
	fprintf(p1,"{");
	fprintf(p2,"{");
	fprintf(p3,"{");
	fprintf(p4,"{");
	for(j = 0;j < 256;j++)//list_1
	{
		fprintf(p1,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][j] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p1,"0x%02x",k);
			if(i != 3)
				fprintf(p1,",");
		}
		fprintf(p1,"}");
		if(j != 0xff)
			fprintf(p1,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_2
	{
		fprintf(p2,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][j] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p2,"0x%02x",k);
			if(i != 3)
				fprintf(p2,",");
		}
		fprintf(p2,"}");
		if(j != 0xff)
			fprintf(p2,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_3
	{
		fprintf(p3,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][j] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p3,"0x%02x",k);
			if(i != 3)
				fprintf(p3,",");
		}
		fprintf(p3,"}");
		if(j != 0xff)
			fprintf(p3,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_4
	{
		fprintf(p4,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][j];
			fprintf(p4,"0x%02x",k);
			if(i != 3)
				fprintf(p4,",");
		}
		fprintf(p4,"}");
		if(j != 0xff)
			fprintf(p4,",\n");
		else
			break;
	}
	fprintf(p1,"}");
	fprintf(p2,"}");
	fprintf(p3,"}");
	fprintf(p4,"}");
	fclose(p1);
	fclose(p2);
	fclose(p3);
	fclose(p4);
	return 0;
} 

同理可得解密的T表生成算法:

#include <stdio.h>
#include <stdlib.h>

typedef unsigned char word_8;

word_8 mul_list[4][256];//9,b,d,e
word_8 cipher[4][4];
int mix[4][4] = {
	{4,2,3,1},
	{1,4,2,3},
	{3,1,4,2},
	{2,3,1,4}};

word_8 mul(word_8 a,word_8 b)
{
	word_8 data[8],dat;
	data[0] = a;
	data[1] = data[0] << 1;
	if((data[0] & 0x80) == 0x80) data[1] ^= 0x1b;
	data[2] = data[1] << 1;
	if((data[1] & 0x80) == 0x80) data[2] ^= 0x1b;
	data[3] = data[2] << 1;
	if((data[2] & 0x80) == 0x80) data[3] ^= 0x1b;
	data[4] = data[3] << 1;
	if((data[3] & 0x80) == 0x80) data[4] ^= 0x1b;
	data[5] = data[4] << 1;
	if((data[4] & 0x80) == 0x80) data[5] ^= 0x1b;
	data[6] = data[5] << 1;
	if((data[5] & 0x80) == 0x80) data[6] ^= 0x1b;
	data[7] = data[6] << 1;
	if((data[6] & 0x80) == 0x80) data[7] ^= 0x1b;
	
	dat = 0x00;
	if((b & 0x01) == 0x01) dat ^= data[0];
	if((b & 0x02) == 0x02) dat ^= data[1];
	if((b & 0x04) == 0x04) dat ^= data[2];
	if((b & 0x08) == 0x08) dat ^= data[3];
	if((b & 0x10) == 0x10) dat ^= data[4];
	if((b & 0x20) == 0x20) dat ^= data[5];
	if((b & 0x40) == 0x40) dat ^= data[6];
	if((b & 0x80) == 0x80) dat ^= data[7];
	
	return dat;
}
	
void make_list()
{
	word_8 i = 0x00;
	do
	{
		mul_list[0][i] = mul(0x09,i);
		mul_list[1][i] = mul(0x0b,i);
		mul_list[2][i] = mul(0x0d,i);
		mul_list[3][i] = mul(0x0e,i);
		i++;
	}while(i != 0x00);
}

int main()
{
	word_8 i,j,k;
	make_list();
	FILE *p1,*p2,*p3,*p4;
	p1 = fopen("DeList_1.txt","wb");
	p2 = fopen("DeList_2.txt","wb");
	p3 = fopen("DeList_3.txt","wb");
	p4 = fopen("DeList_4.txt","wb");
	fprintf(p1,"{");
	fprintf(p2,"{");
	fprintf(p3,"{");
	fprintf(p4,"{");
	for(j = 0;j < 256;j++)//list_1
	{
		fprintf(p1,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][j] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p1,"0x%02x",k);
			if(i != 3)
				fprintf(p1,",");
		}
		fprintf(p1,"}");
		if(j != 0xff)
			fprintf(p1,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_2
	{
		fprintf(p2,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][j] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p2,"0x%02x",k);
			if(i != 3)
				fprintf(p2,",");
		}
		fprintf(p2,"}");
		if(j != 0xff)
			fprintf(p2,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_3
	{
		fprintf(p3,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][j] ^
				mul_list[mix[i][3] - 1][0];
			fprintf(p3,"0x%02x",k);
			if(i != 3)
				fprintf(p3,",");
		}
		fprintf(p3,"}");
		if(j != 0xff)
			fprintf(p3,",\n");
		else
			break;
	}
	for(j = 0;j < 256;j++)//list_4
	{
		fprintf(p4,"{");
		for(i = 0;i < 4;i++)
		{
			k = mul_list[mix[i][0] - 1][0] ^
				mul_list[mix[i][1] - 1][0] ^
				mul_list[mix[i][2] - 1][0] ^
				mul_list[mix[i][3] - 1][j];
			fprintf(p4,"0x%02x",k);
			if(i != 3)
				fprintf(p4,",");
		}
		fprintf(p4,"}");
		if(j != 0xff)
			fprintf(p4,",\n");
		else
			break;
	}
	fprintf(p1,"}");
	fprintf(p2,"}");
	fprintf(p3,"}");
	fprintf(p4,"}");
	fclose(p1);
	fclose(p2);
	fclose(p3);
	fclose(p4);
	return 0;
} 

主要函数

最后,我们通过查表实现AES算法的加解密:

#include <stdio.h>
#include <stdlib.h>
#include "Lists.h"

word_8 RoundK[11][16];
word_32 Key[4] = {0x2b7e1516,0x28aed2a6,0xabf71588,0x09cf4f3c};

void Look(word_8 Str[])
{
	int i;
	for(i = 0;i < 16;i++)
		printf("%02x",Str[i]);
	printf("\n");
}

void Make_Key()
{
	word_32 k[44] = {0};
	int i,j;
	for(i = 0;i < 4;i++)
		k[i] = Key[i];
	for(;i < 4 * 11;i++)
	{
		if(i % 4 == 0)
			k[i] = k[i - 4] ^ (
			(S_box[(k[i - 1] >> 16) & 0x000000ff] << 24) ^
			(S_box[(k[i - 1] >> 8) & 0x000000ff] << 16) ^
			(S_box[(k[i - 1]) & 0x000000ff] << 8) ^
			(S_box[(k[i - 1] >> 24) & 0x000000ff])) ^ Rcon[(i / 4) - 1];
		else
			k[i] = k[i - 4] ^ k[i - 1];
	}
	for(i = 0;i < 11;i++)
		for(j = 0;j < 16;j++)
			RoundK[i][j] = k[i * 4 + j / 4] >> (((3 - (j % 4)) * 8) & 0x000000ff);
}

void Sub_Bytes(word_8 plain[],word_8 cipher[])
{
	int i = 0;
	for(i = 0;i < 16;i++)
		cipher[i] = S_box[plain[i]];
}

void De_Sub_Bytes(word_8 cipher[],word_8 plain[])
{
	int i = 0;
	for(i = 0;i < 16;i++)
		plain[i] = De_S_box[cipher[i]];
}

void Shift_Rows(word_8 plain[],word_8 cipher[])
{
	cipher[0] = plain[0];
	cipher[1] = plain[5];
	cipher[2] = plain[10];
	cipher[3] = plain[15];
	cipher[4] = plain[4];
	cipher[5] = plain[9];
	cipher[6] = plain[14];
	cipher[7] = plain[3];
	cipher[8] = plain[8];
	cipher[9] = plain[13];
	cipher[10] = plain[2];
	cipher[11] = plain[7];
	cipher[12] = plain[12];
	cipher[13] = plain[1];
	cipher[14] = plain[6];
	cipher[15] = plain[11];
}

void De_Shift_Rows(word_8 cipher[],word_8 plain[])
{
	plain[0] = cipher[0];
	plain[1] = cipher[13];
	plain[2] = cipher[10];
	plain[3] = cipher[7];
	plain[4] = cipher[4];
	plain[5] = cipher[1];
	plain[6] = cipher[14];
	plain[7] = cipher[11];
	plain[8] = cipher[8];
	plain[9] = cipher[5];
	plain[10] = cipher[2];
	plain[11] = cipher[15];
	plain[12] = cipher[12];
	plain[13] = cipher[9];
	plain[14] = cipher[6];
	plain[15] = cipher[3];
}

void Mix_Columns(word_8 plain[],word_8 cipher[])
{
	word_8 a[4];
	int i,j;
	for(i = 0;i < 4;i++)
	{
		for(j = 0;j < 4;j++)
			a[j] = T1[plain[i * 4]][j] ^
					T2[plain[i * 4 + 1]][j] ^
					T3[plain[i * 4 + 2]][j] ^
					T4[plain[i * 4 + 3]][j];
		for(j = 0;j < 4;j++)
			cipher[i * 4 + j] = a[j];
	}
}

void De_Mix_Columns(word_8 cipher[],word_8 plain[])
{
	word_8 a[4];
	int i,j;
	for(i = 0;i < 4;i++)
	{
		for(j = 0;j < 4;j++)
			a[j] = De_T1[cipher[i * 4]][j] ^
					De_T2[cipher[i * 4 + 1]][j] ^
					De_T3[cipher[i * 4 + 2]][j] ^
					De_T4[cipher[i * 4 + 3]][j];
		for(j = 0;j < 4;j++)
			plain[i * 4 + j] = a[j];
	}
}

void Add_Round_Key(word_8 plain[],word_8 cipher[],int k)
{
	int i;
	for(i = 0;i < 16;i++)
		cipher[i] = plain[i] ^ RoundK[k][i];
}

void Encrypt(word_8 plain[],word_8 cipher[])
{
	int i;
	Make_Key();
//	Look(plain);
	Add_Round_Key(plain,cipher,0);
//	Look(cipher);
	for(i = 1;i <= 9;i++)
	{
		Sub_Bytes(cipher,plain);
//		Look(plain);
		Shift_Rows(plain,cipher);
//		Look(cipher);
		Mix_Columns(cipher,plain);
//		Look(plain);
		Add_Round_Key(plain,cipher,i);
//		Look(cipher);
	}
	Sub_Bytes(cipher,plain);
//	Look(plain);
	Shift_Rows(plain,cipher);
//	Look(cipher);
	Add_Round_Key(cipher,plain,i);
//	Look(plain);
	for(i = 0;i < 16;i++)
		cipher[i] = plain[i];
}

void Decrypt(word_8 cipher[],word_8 plain[])
{
	int i;
	Make_Key();
//	Look(cipher);
	Add_Round_Key(cipher,plain,10);
//	Look(plain);
	for(i = 9;i >= 1;i--)
	{
		De_Shift_Rows(plain,cipher);
//		Look(cipher);
		De_Sub_Bytes(cipher,plain);
//		Look(plain);
		Add_Round_Key(plain,cipher,i);
//		Look(cipher);
		De_Mix_Columns(cipher,plain);
//		Look(plain);
	}
	De_Shift_Rows(plain,cipher);
//	Look(cipher);
	De_Sub_Bytes(cipher,plain);
//	Look(plain);
	Add_Round_Key(plain,cipher,i);
//	Look(cipher);
	for(i = 0;i < 16;i++)
		plain[i] = cipher[i];
}

其中 Lists.h 头文件中存放的是所有的表。
加解密分别调用EncryptDecrypt即可。

注:若觉得速度还是不够快,可以将所有的函数调用都去掉,所有循环全部写开,虽然这样不利于阅读,但算法的运行速度又会有一个显著的提升。

  • 14
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梓丶城

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值