数据ETL——使用R语言对身份证进行校验,排序筛选等操作
数据ETL——使用R语言对身份证进行校验,排序筛选等操作
CSV格式如图所示
1、分别查询:
吉林省的身份证号码(参考GB/T2260-2007标准)
校验码不正确的无效身份证号码
50岁以上人的身份证号码
2、分别排序:
按年龄降序排列
先按性别排序(女士在前),若性别相同则按年龄升序排列
3、生成新列:
性别(列名sex,类型为factor,值为Female或Male)、生日(列名Birthday,类型为date)、有效否(列名Valid,类型Logic)
4、统计:
原创
2021-04-19 09:35:32 ·
1301 阅读 ·
0 评论