【敏感数据识别】手机号编码规则(准确率较高)

一、编码规则

中国内地手机号由1开头的11位数字构成,其中前7位称为手机号段。

二、普通手机号正则常见问题

易将数据库主键(id),或11位的编号(如userId)识别为手机号

三、解决办法

部分号段为虚拟号号段、物联网号段,普通人的手机号不会在这些号段内,因此在对数据进行识别时,可以排除这些号段,提升识别准确率。

四、常见号段

电信:133、153、173、177、180、181、189、191、193、199
联通: 130、131、132、155、156、166、167、171、175、176、185、186
移动:134、135、136、137、138、139、147、150、151、152、157、158、159、172、178、182、183、184、187、188、195、198

五、建议舍弃号段

以下是参考资料中认定为特殊业务号段 且 本人选取了几百个真实手机号作为测试数据,从中调研出的用得较少的号段:
(1)电信
141 :物联网业务专属号段且测试数据中,真实手机号无此号段
149:上网卡专属号段且测试数据中,此号段数量较少
174 :卫星电话号段且测试数据中,此号段数量较少
190 :测试数据中,真实手机号无此号段

(2)联通
145 :上网卡专属号段且测试数据中,此号段数量较少
172 、146:物联网业务专属号段且测试数据中,真实手机号无此号段
196 :测试数据中,真实手机号无此号段

(3)移动
148:虚拟运营商号段且测试数据中,真实手机号无此号段
197:测试数据中,真实手机号无此号段
1440 :物联网业务专属号段且测试数据中,真实手机号无此号段

六、参考资料

注:工信部及三大运营商官网并无号段相关数据,所以只能参考网上博客资料

https://cloud.tencent.com/developer/article/2054311
https://blog.csdn.net/chsfish/article/details/120283172
https://blog.csdn.net/qq_43506952/article/details/91958177

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值