凯撒密码的自动化破解方法(适用于英文文本)
凯撒密码
凯撒加密是有记载的最古老的加密方法。原始的凯撒密码没有密钥,加密方式很原始,就是通过将字母表循环右移三位进行加密:a被D替代,b被E替代,…,x被A替代,y被B替代,z被C替代。
我们现在引入密钥。将字母表看作数字{0,1,2,…,25}(而不是英文字符),密钥k是一个0到25直接的数。加密算法使用密钥k将英文字母组成的明文的每个字母向后移动k个位置,解密算法使用相同的密钥k将密文的每个字母向前移动k个位置。
数学化的描述如下:
- 明文空间M = 密文空间C = {0,1,2,..,25}
- 密钥空间K = {0,1,2,…,25}
- 加密算法Enc: c = (m+k) mod 26
- 解密算法Dec: m = (c - k) mod 26
下面给出加解密的C代码实现
//加密算法,密钥key 明文文件src_file 生成密文文件des_file
void enc(const char des_file[], const char src_file[], int key)
{
FILE *fin = fopen(src_file, "r");
FILE *fout = fopen(des_file, "w");
char ch, tem;
while ((ch = fgetc(fin)) != EOF) {
tem = tolower(ch);
tem = 'a' + (tem-'a'+key) % 26;
if (islower(ch)) ch = tem;
else if (isupper(ch)) ch = toupper(tem);
fputc(ch, fout);
}
fclose(fin);
fclose(fout);
}
//解密算法,密钥key 密文文件src_file 生成原文件des_file
void dec(const char des_file[], const char src_file[], int key)
{
FILE *fin = fopen(src_file, "r");
FILE *fout = fopen(des_file, "w");
char ch, tem;
while ((ch = fgetc(fin)) != EOF) {
tem = tolower(ch);
tem = 'a' + (tem-'a'+26-key) % 26;
if (islower(ch)) ch = tem;
else if (isupper(ch)) ch = toupper(tem);
fputc(ch, fout);
}
fclose(fin);
fclose(fout);
}
朴素的穷举攻击方法
由于凯撒密码的密钥量太小了,只有26个可能的密钥,因而非常容易尝试每个密钥,并观察哪个密钥解密密文后得到的明文“有意义”。这种方法的缺点就是很难自动进行,因为对于计算机而言查看明文是否“有意义”比较困难(也并非不可能,比如通过查看包含有效英文单词的字典来完成)。有些情况下,明文字符符合英文文本的分布规律,但是明文本身不是有效的英文文本,这使得问题变得更加困难。
结合频度分析的自动化攻击
凯撒密码中每个字符的映射是固定的,因此如果字母a映射到D,那么每次a在明文中出现的时候,都会导致字母D在密文中出现。英语中单个字母的概率分布是已知的,不同的字母在不同文本中的平均出现频率通常是一样的,文本越长,频率计算就越接近平均值。但是,即使是相对较短的文本(仅有几十个字)已经足够接近平均值的分布了。
下面给出频率分布表(存放在double数组中)
#define LIST_LEN 26
const double p[LIST_LEN] = {
0.082,0.015,0.028,0.042,0.127,
0.022,0.02, 0.061,0.07, 0.001,