由于项目需要,我写了一个针对hiva数据库的加密函数。
String output = Base64.encodeBase64String(content);
这样加密出来的output在中间和最后会出现\r\n的换行字符,查找资料后发现:
据RFC 822规定,每76个字符,还需要加上一个回车换行,这里简直就是个巨坑,这个密文我在存入hive text格式的table后会出现串行的情况,期初我一直以为是text格式的表在解析的时候出现的问题,因为其他格式比如parquet和ORCFILR格式的在存储的时候都没有相应的问题。
解决:
output.replaceAll("\r\n", "").replaceAll("\r", "").replaceAll("\n", "");
替换出现的换行字符。再次部署hive函数,问题得到解决。没有出现串行的问题了。
但是我担心这样的替换,会替换掉密文中不是因为超过76个字符生成的\r\n,这样可能会导致解密的问题。查询源码发现:
/**
* This array is a lookup table that translates 6-bit positive integer index values into their "Base64 Alphabet"
* equivalents as specified in Table 1 of RFC 2045.
*
* Thanks to "commons" project in ws.apache.org for this code.
* http://svn.apache.org/repos/asf/webservices/commons/trunk/modules/util/
*/
private static final byte[] STANDARD_ENCODE_TABLE = {
'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'
};
上面试base64的原文table字符。根本不包含"",当然也就出现了密文中出现\r\n的情况。
问题根源就是回车换行符,那删除就行了,谷歌后又发现一问题,原来“回车换行符(\r\n)”是在Windows才有,而Linux只有换行(\n),Mac只有回车(\r)。
所以这样替换的方式对三种操作系统都可行。