hashlib —— Python 的 md5 和 sha1 加密

python的md5和sha1加密

0. md5 与 sha1

  • MD5 的全称是 Message-Digest Algorithm 5(信息-摘要算法)。128 位长度。目前 MD5 是一种不可逆算法。具有很高的安全性。它对应任何字符串都可以加密成一段唯一的固定长度的代码。

    • md5 的应用场景:
      • 加密网站注册用户的密码。 (但去年的各大网站密码泄漏事件确实让人蛋疼……)
      • 网站用户上传图片 / 文件后,计算出 MD5 值作为文件名。(MD5可以保证唯一性)
      • key-value数据库中使用MD5值作为key。
      • 比较两个文件是否相同。(大家在下载一些资源的时候,就会发现网站提供了MD5值,就是用来检测文件是否被篡改)
        ……
  • SHA1 的全称是 Secure Hash Algorithm(安全哈希算法) 。SHA1 基于MD5,加密后的数据长度更长,它对长度小于 264 的输入,产生长度为 160 bit 的散列值。比 MD5 多 32 位。因此,比 MD5 更加安全,但SHA1的运算速度就比 MD5 要慢了。

1. hashlib 下的使用

import hashlib
text = 'This is a md5 text.'

text_md5 = hashlib.md5(text.encode('utf-8'))
text_md5.hexdigest()

text_sha1 = hashlib.sha1(text.encode('utf-8'))
text_sha1.hexdigest()

# 或者采用如下的方式进行散列
m = hashlib.md5()
m.update(text.encoding('utf-8'))
m.hexdigest()

对要散列编码的文本,必须要重新指定编码,一般选择utf-8,详见 “TypeError: Unicode-objects must be encoded before hashing”

2. 大文件的哈希散列

def gen_md5(f):

    f_md5 = hashlib.md5()
    while True:
        data = f.read(1024)
        if not data:
            break
                # not '': 返回为 True
        f_md5.update(data)
    return f_md5.hexdigest()

一个更 python 风格的实现:

def md5(fname):
    hash_md5 = hashlib.md5()
    with open(fname, "rb") as f:
        for chunk in iter(lambda: f.read(4096), b""):
            hash_md5.update(chunk)
    return hash_md5.hexdigest()

iter(lambda: f.read(4096), b”“):

  • 第一个参数(lambda: f.read(4096))为 callable 对象,这里为函数对象;
  • 第二个参数为 sentinel,当不断地调用第一个参数,返回为 sentinel 时,迭代终止;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值