需求
我们在对数据脱敏的情况下,往往存储到db中是加密后的数据,一般这种数据是没有可读性的,进行查询也是通过加密后的参数进行完全匹配;
但是我们的需求如果是参数只是字段中的一部分,进行模糊匹配应该怎么做呢?
例如:数据库字段 key = _+fhdks+ajle==_s0
实际存储的key =
我的天啊
我们进行搜索时,参数为我的天啊
并加密成上面的密文之后进行匹配;
思路
我的思路是这样,如果要进行模糊匹配,则我们的参数必定是原文中的一部分,参考数据库like函数;我们的思路如下;
1、首先在存储的时候需要分段加密
例如:我的天啊
我们可以两个汉字分一段,“我的
”,“的天
”,“天啊
” 进行分三次加密
(这里大家可以自定义算法,但是不要太短的组合,避免安全下降)
2、然后把分段加密的密文拼接起来
例如:“我的
”,“的天
”,“天啊
”
密文:“kshe!_=s
”,“ek(+=s2F
”,“2J0s=sw_
”
结果:kshe!_=sek(+=s2F2J0s=sw_
3、这样就可以模糊匹配了
把命中的密文按照规则解密出来就是我们需要的内容
缺点
• 支持模糊查询加密方式,得到的密文比较长;
• 支持的模糊查询子句长度不支持过短的查询(出于安全考虑);
• 返回的结果列表中有可能有多余的结果,需要增加筛选的逻辑:对记录先解密,再筛选;