Python使用openpyxl和pandas处理Excel文件实现数据脱敏案例一则

youyouxiong

于 2022-11-03 14:45:25 发布

阅读量1k

点赞数

分类专栏： python 文章标签： pandas python excel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youyouxiong/article/details/127670029

版权

python 专栏收录该内容

15 篇文章 3 订阅

订阅专栏

问题描述：

所谓数据脱敏，是指对个人的学号、姓名、身份证号、银行账号、电话号码、家庭住址、工商注册号、纳税人识别号等敏感信息进行隐藏、随机化或删除，防止在数据交换或公开场合演示时泄露隐私信息，是数据处理时经常谈到的一个概念，也是大数据伦理学中需要考虑的一个重要内容。不同的业务类型、数据和使用场景中，敏感数据的定义是变化的，某个信息在一个场景下是敏感的需要脱敏处理而在另一个场景中必须保留原始数据是正常的。

本文以学生考试数据为例，学生在线机考（后台发送“小屋刷题”可以下载刷题和考试软件）结束后导出的原始数据中包含学号、姓名等个人信息，在某些场合下使用这些数据时，截图需要打上马赛克，或者替换原始数据中的这两个信息进行脱敏，原始数据格式如下：

在原始数据中，每个学生的考试数据有很多条，脱敏处理后这些数据的学号和姓名被随机化，但仍需要保证是同一个学生的数据，处理后数据格式如下：

代码：

import pandas as pd
##from  sqlalchemy import  create_engine
from random import  choices
from string  import ascii_letters,digits

path = r'E:\D\学生成绩目录\XXB.xlsx'

df  =pd.read_excel(path)


ids =set(df.身份证号) ###列名
names =set(df.姓名)
csds =set(df.出生地) 


id_mapping ={si:''.join(choices(digits,k=18))for si in ids}
df.身份证号  =df.身份证号.map(id_mapping)

name_mapping ={name:''.join(choices(ascii_letters,k=6)) for name in names}
df.姓名  =df.姓名.map(name_mapping)

csd_mapping ={csd:''.join(choices(ascii_letters,k=6)) for csd in csds}
df.出生地  =df.出生地.map(csd_mapping)





df.to_excel(r'E:\学生成绩目录\XXB221.xlsx',sheet_name='sheet1',index=False)
print('运行成功!')

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python使用openpyxl和pandas处理Excel文件实现数据脱敏案例一则

Python使用openpyxl和pandas处理Excel文件实现数据脱敏案例一则
复制链接

扫一扫

专栏目录

博客等级

码龄6年

315
原创

2697
点赞

3792
收藏

2501
粉丝

关注

私信

热门文章

分类专栏

python 15篇
Script 1篇
js 3篇
C# 1篇
Java面试题 1篇
mysql 1篇
chatgpt
oracle 9篇
node 5篇
MongoDB 1篇
git 3篇
web前端 6篇
vue 2篇
kettle抽取数据 3篇
微信小程序 1篇
PHP后台 1篇
hexo

最新评论

Python 大麦抢票脚本
PerfXCloud大模型开发zwh: 文章详细介绍了用Python的requests和BeautifulSoup模块编写抢票脚本的方法，从数据抓取到异常处理，再到成功提示，步骤清晰，对想要自动化购票的Python开发者来说是个不错的参考。
俄罗斯方块c语言
穷苦书生_万事愁: 博主的这篇关于“俄罗斯方块c语言”的博客文章，真是让我眼前一亮。通过博主深入浅出的讲解，我对这个主题有了全新的认识，同时也深深感受到了博主的专业和用心。文章中的细节描写非常到位，让我受益匪浅，仿佛置身其中。期待博主能够持续分享更多这样有价值的好文，同时也希望能够得到博主的指导，一同共同进步。再次感谢博主的用心分享和支持！
俄罗斯方块c语言
小王毕业啦: 博主的文章真是让我眼前一亮，对"俄罗斯方块c语言"这个主题有了全新的了解。从细节描写中可以感受到博主的深厚功底和对于技术的热爱。期待博主未来能够继续分享更多这样有价值的好文，同时也希望能够在博主的指导下共同进步。感谢博主的无私分享和支持！
Python PDF转化wolrd代码怎么写
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【神经网络】资源
猫头虎: 🌈🐅🔬 这样的博客太有价值了！内容精彩，条理清晰，期待下一篇更文！🛸

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

youyouxiong 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。