joblib提供了三个与对象序列化和模型固化相关的函数hash,dump,load。joblib.hash主要是为了提供一个numpy对象的hash方法,joblib.dump
并joblib.load
替代了pickle,使其可以在包含大数据(尤其是大型numpy数组)的任意Python对象上高效工作。
-
hash
joblib.hash(obj,hash_name ='md5',coerce_mmap = False )
参数:
hash_name:'md5'或'sha1'
使用哈希算法。sha1应该更安全,但是md5更快。
coerce_mmap:布尔值
np.memmap和np.ndarray之间没有区别
快速计算哈希值,以唯一标识包含numpy数组的Python对象。主要是因为python自带的hash函数不支持numpy对象的hash值计算。
-
dump
joblib.dump(value, fil