前言 遇到这么一串代码: 理解 key=hash_vocab(vocab)。 作者的这串代码做的就是:我读入一个数据集,建立一个vocab,只要数据集不同,vocab里面的单词就一定不同。所以: 首先,hashlib.sha256会随机产生一段密钥然后遍历这一个vocab中的所有单词(注意要先排序,如果是乱序,那么同一个数据集,最终迭代产生的密钥也是不同的)。对单词先encode,然后更新这个密钥最后使用.hexdigest()返回最终的密钥。 也就是下面的文件名: