编码就是把常见的数字、字符等转换成QR码的方法。说具体的编码之前,先说一下QR码的最大容量问题。
一、最大容量
QR码的最大容量取决于选择的版本、纠错级别和编码模式(Mode:数字、字符、多字节字符等)。以版本1、纠错级别为Level Q的QR码为例,可以存储27个纯数字,或17个字母数字混合字符或11个8bit字节数据。如果要存储同样多的内容同时提高纠错级别,则需要采用更高的版本。版本1~9 数据容量、纠错码容量对照如下表:
(version) | (error correcting level) | (count of data code words) | count of EC code words | (numeric) | (alphanumeric) | 8bit |
---|---|---|---|---|---|---|
1 | L | 19 | 7 | 41 | 25 | 17 |
M | 16 | 10 | 34 | 20 | 14 | |
Q | 13 | 13 | 27 | 16 | 11 | |
H | 9 | 17 | 17 | 10 | 7 | |
2 | L | 34 | 10 | 77 | 47 | 32 |
M | 28 | 16 | 63 | 38 | 26 | |
Q | 22 | 22 | 48 | 29 | 20 | |
H | 16 | 28 | 34 | 20 | 14 | |
3 | L | 55 | 15 | 127 | 77 | 53 |
M | 44 | 26 | 101 | 61 | 42 | |
Q | 34 | 36 | 77 | 47 | 32 | |
H | 26 | 44 | 58 | 35 | 24 | |
4 | L | 80 | 20 | 187 | 114 | 78 |
M | 64 | 36 | 149 | 90 | 62 | |
Q | 48 | 52 | 111 | 67 | 46 | |
H | 36 | 64 | 82 | 50 | 34 | |
5 | L | 108 | 26 | 255 | 154 | 106 |
M | 86 | 48 | 202 | 122 | 84 | |
Q | 62 | 72 | 144 | 87 | 60 | |
H | 46 | 88 | 106 | 64 | 44 | |
6 | L | 136 | 36 | 322 | 195 | 134 |
M | 108 | 64 | 255 | 154 | 106 | |
Q | 76 | 96 | 175 | 108 | 74 | |
H | 60 | 112 | 139 | 84 | 58 | |
7 | L | 156 | 40 | 370 | 224 | 154 |
M | 124 | 72 | 293 | 178 | 122 | |
Q | 88 | 108 | 207 | 125 | 86 | |
H | 66 | 130 | 154 | 93 | 64 | |
8 | L | 194 | 48 | 461 | 279 | 192 |
M | 154 | 88 | 365 | 221 | 152 | |
Q | 110 | 132 | 259 | 157 | 108 | |
H | 86 | 156 | 202 | 122 | 84 | |
9 | L | 232 | 60 | 552 | 335 | 230 |
M | 182 | 110 | 432 | 262 | 180 | |
Q | 132 | 160 | 312 | 189 | 130 | |
H | 100 | 192 | 235 | 143 | 98 |
如果要了解更详细的QR码容量信息,可以到电装的网站去看看http://www.denso-wave.com/qrcode/vertable1-e.html。
下面,就举例说明将“ABCDE123”转换成为版本1、Level H的QR码转换方法。
二、模式标识符(Mode Indicator)
QR码的模式(Mode)就是前文提到的数字、字符、8bit 字节码、多字节码等。对于不同的模式,都有对应的模式标识符(Mode Indicator)来帮助解码程序进行匹配,模式标识符是4bit的二进制数:
1、数字模式(numeric mode ): 0001
2、混合字符模式(alphanumeric mode) : 0010
3、8bit byte mode: 0100
4、日本汉字(KANJI mode) : 1000
5、中国汉字(GB2312):1101
由于示例文本串是混合字符,因此将选择alphanumeric mode,其标识码为:0010
三、文本串计数标识符(Character count indicator)
文本串计数标识符用来存储源内容字符串的长度,在版本1-9的QR码中,文本串长度标识符自身的长度被定义为:
数字 : 10bit
混合字符 : 9bit
8bit 字节码 : 8bit
多字节码 : 8bit
在本例中,源文本串的长度为8个字符,混合字符的长度为9bit,因此将字符个数8编码为9位二进制表示:000001000
加上混合字符模式标识码,总的编码为0010 000001000
四、数据内容编码
1、数字模式下的编码
在数字模式下,数据被限制为3个数字一段,分成若干段。如:"123456" 将分成"123" 和 "456",分别被编码成10bit的二进制数。“123”的10bit二进制表示法为:0001111011,实际上就是二进制的123。
当数据的长度不足3个数字时,如果只有1个数字则用4bit,如果有2个数字就用7个bit来表示。
如:"9876"被分成"987"和"6"两段,因此被表示为"1111011011 0110"。
2、混合字符模式下的编码
混合字符模式编码,其字符对照表如下:
0 | 0 | A | 10 | K | 20 | U | 30 | + | 40 | ||||
1 | 1 | B | 11 | L | 21 | V | 31 | - | 41 | ||||
2 | 2 | C | 12 | M | 22 | W | 32 | . | 42 | ||||
3 | 3 | D | 13 | N | 23 | X | 33 | / | 43 | ||||
4 | 4 | E | 14 | O | 24 | Y | 34 | : | 44 | ||||
5 | 5 | F | 15 | P | 25 | Z | 35 | ||||||
6 | 6 | G | 16 | Q | 26 | [sp] | 36 | ||||||
7 | 7 | H | 17 | R | 27 | $ | 37 | ||||||
8 | 8 | I | 18 | S | 28 | % | 38 | ||||||
9 | 9 | J | 19 | T | 29 | * | 3 |
编码方式为:
源码被分成两个字符一段,如下所示,每段的第一个字符乘上45,再用第二个数字相加。因此每段变成了11bit的2进制码,如果字符个数只有1个,则用6bit表示。
示例:
"AB" | "CD" | "E1" | "23" | ||
45*10+11 | 45*12+13 | 45*14+1 | 45*2+3 | ||
461 | 553 | 631 | 93 | ||
0010 | 000001000 | 00111001101 | 01000101001 | 01001110111 | 00001011101 |
3、8bit字节数据不经编码转换直接保存。
五、编码终止符(Terminator)
如果编码后的字符长度不足当前版本和纠错级别所存储的容量,则在后续补"0000",如果容量已满则无需添加终止符。此时得到的编码串为:
0010 000001000 00111001101 01000101001 01001110111 00001011101 0000
六、编成8bit码字(Code words)
将以上的编码再按8bit一组,形成码字(code words):
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000
如果尾部数据不足8bit,则在尾部充0:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000
如果编码后的数据不足版本及纠错级别的最大容量,则在尾部补充 "11101100" 和 "00010001",直到全部填满。最后,版本1、Level H下的"ABCDE123" 的QR码是:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100
十进制表示法为:
32 65 205 69 41 220 46 128 236