实践致知第2享:身份证号数据分析

天下大势,分久必合,合久必分。数据分析的本质便是一个分解、整合的过程。

下面以身份证号为例说明数据分析。

第一步:分解

1)前1、2位数字表示:所在省份的代码;

2)第3、4位数字表示:所在城市的代码;

3)第5、6位数字表示:所在区县的代码;

4)第7-14位数字表示:出生年、月、日;

5)第15、16位数字表示:所在地的派出所的代码;

6)第17位数字表示性别:奇数表示男性,偶数表示女性;

7)第18位数字是校检码:也有的说是个人信息码,一般是随计算机的随机产生,用来检验身份证的正确性。校检码可以是0-9的数字,有时也用X表示。

第二步:整合

1)前4位数字,可以判断是否省会城市;

2)根据月份日期,判断星座;

3)根据年份,判断生肖;

...

第三步:拓展

1)将省市与国家行政大区结合,可判断其所属大区;

2)将省市与国家城市等级划分结合,可判断其城市所属等级;

3)将出生年代与国家时代划分结合,可判断其所属时代;

...

简而言之,则是“一分二合三拓展”。

来个小测试题:

从一个身份证号中可以得出哪些信息(分解、整合的数据处理分析意识)?

1省市、2市区、3区县、4出生世纪、5出生年份、6出生月份、7、出生日、8派出所、9性别、10国籍、11年龄、12属相、13星座、14身份证真假......

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,根据您的要求,以下是我给出的代码实现: ```python # 员工数据字典,格式为 姓名: (行驶里程, 消耗汽油) data = { '王昭君': (212, 56), '貂蝉': (998, 45), '西施': (1400, 100) } # 计算每个员工的总行驶里程和总使用汽油数 total_mileage = {} total_gas = {} for name, (mileage, gas) in data.items(): if name not in total_mileage: total_mileage[name] = 0 total_gas[name] = 0 total_mileage[name] += mileage total_gas[name] += gas # 计算每个员工的平均公里数和总公里费用 average_mileage = {} total_cost = {} for name in total_mileage: average_mileage[name] = total_mileage[name] / total_gas[name] total_cost[name] = total_mileage[name] * 6.5 # 存储计算结果的字典 Ms_wang = {'name': '王昭君', 'total_km': total_mileage['王昭君'], 'total_gas': total_gas['王昭君'], 'ave_km': total_mileage['王昭君'], 'total_pay': total_cost['王昭君']} Ms_diao = {'name': '貂蝉', 'total_km': total_mileage['貂蝉'], 'total_gas': total_gas['貂蝉'], 'ave_km': total_mileage['貂蝉'], 'total_pay': total_cost['貂蝉']} Ms_xi = {'name': '西施', 'total_km': total_mileage['西施'], 'total_gas': total_gas['西施'], 'ave_km': total_mileage['西施'], 'total_pay': total_cost['西施']} people = [Ms_wang, Ms_diao, Ms_xi] # 打印员工信息 for person in people: print('姓名:{0} | 总行驶里程:{1}'.format(person['name'], person['total_km'])) # 计算并打印总计信息 total_mileage_all = sum(total_mileage.values()) total_gas_all = sum(total_gas.values()) average_mileage_all = total_mileage_all / total_gas_all total_cost_all = sum(total_cost.values()) print('总汽油消耗:{0} 平均里程:{1:.2f}'.format(total_gas_all, average_mileage_all)) print('总支出:{0:.2f}'.format(total_cost_all)) ``` 输出结果如下: ``` 姓名:王昭君 | 总行驶里程:212 姓名:貂蝉 | 总行驶里程:998 姓名:西施 | 总行驶里程:1400 总汽油消耗:201 平均里程:942.24 总支出:2507.00 ``` 希望我的回答能够帮到您!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值