python 批量md5加密_python UDF 实现对csv批量md5加密操作

本文介绍了如何使用Python脚本和Hive用户定义函数(UDF)来批量加密CSV文件中的数据,特别是手机号码。通过Python的hashlib库和Hive的Java UDF,实现了对数据的32位MD5加密,确保数据安全。提供了详细的Python代码示例和Hive UDF的创建与使用方法。
摘要由CSDN通过智能技术生成

工作上遇到需求,一批手机号要md5加密导出。为了保证数据安全,所以没有采用网上工具来加密。

md5的加密算法是开源的且成熟的,很多语言都有对应包可以直接用,我写了一个简单的python来实现,另一位同事做了一个hiveudf来实现,这里都给大家分享一下。

目标:

读取csv文件,并且对其中的内容进行md5加密,32位加密,将加密后的密文存入另一个csv文件。

python实现:

(1)准备好要读取的csv文件。单列,一行存一个手机号码。

f6ea52ef77b4d2b04dd81a78d06d7820.png

(2)python代码:

#encoding=utf8

import hashlib #加密模块

import os

#定义一个加密函数,32位md5加密

def md5_encryption(str):

m=hashlib.md5()

m.update(str)

return m.hexdigest()

#准备要读取的csv和要被写入的csv,两个文件要和此python放在同一个文件夹里

readfilename=os.path.join(os.path.dirname(__file__),"testcsv.csv")

writefilename=os.path.join(os.path.dirna

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值