小编典典
如果您在0-127范围内有18个字符,在0-999范围内有一个数字,并对其进行尽可能的压缩,则将需要17个字节。
>>> math.log(128**18 * 1000, 256)
16.995723035582763
您可能可以利用某些字符极有可能未被使用的事实。特别是,不可能有任何字符低于值32,并且也可能不使用127。如果可以找到另一个未使用的字符,则可以先将这些字符转换为以94为基数,然后将它们尽可能紧密地包装到字节中。
>>> math.log(94**18 * 1000, 256)
15.993547951857446
这 正好 适合16个字节!
范例程式码
这是一些用Python编写的示例代码(但以非常命令式的风格编写,以便非Python程序员可以轻松理解)。我假设~输入中没有波浪号()。如果有,则应在编码字符串之前用另一个字符替换它们。
def encodeChar(c):
return ord(c) - 32
def encode(s, n):
t = 0
for c in s:
t = t * 94 + encodeChar(c)
t = t * 1000 + n
r = []
for i in range(16):
r.append(int(t % 256))
t /= 256
return r
print encode(' ', 0) # smallest possible value
print encode('abcdefghijklmnopqr', 123)
print encode('}}}}}}}}}}}}}}}}}}', 999) # largest possible value
输出:
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
[ 59, 118, 192, 166, 108, 50, 131, 135, 174, 93, 87, 215, 177, 56, 170, 172]
[255, 255, 159, 243, 182, 100, 36, 102, 214, 109, 171, 77, 211, 183, 0, 247]
该算法使用Python处理大量数字的能力。要将代码转换为C ++,可以使用一个大的整数库。
当然,您将需要一个等效的解码功能,原理是相同的-操作以相反的顺序执行。
2020-07-28