在先前数据模拟一文中,我们谈到了身份证号的尾数校验。
身份证尾数就是第十八位数的校验码。计算方法是将身份证前十七位数分别乘以不同系数,7、9、10、5、8、4、2、1、6、3、7、9、10、5、8、4、2,再把相乘的结果相加,和除以11,看看余数是多少。余数只可能有0、1、2、3、4、5、6、7、8、9、10这十一个数字,其分别对应的最后一位身份证的号码为1、0、X、9、8、7、6、5、4、3、2,这样就得出了第二代身份证第十八位数的校验码。
不过当时为了生成数据的简便性,并没有用上,而是采取了随机。现在就把它完善下,用的是上次生成的身份证号数据。
大致思路就是,提取原身份证号的前17位数,并逐个拆分。比如上面的32万条数据,可拆成一个320000 X 17的矩阵。然后利用矩阵乘法,按上面校验位的定义进行计算,求余数,再换成对应的字符,最后和原来的前17位拼接起来,形成最新且正确的身份证号码。