MolHash是一个从分子结构根据不同hash函数生成不同hashes的算法,适用于不同应用场景下的分子搜索,并能够极大的提升检索速度。
首先,下表总结了可用的分子哈希,它们的计算是否改变了结构,以及它们是否对特定分子特征的存在敏感(或不变)。如果特定的哈希函数对分子特征敏感,但这不是必需的,那么应该对分子进行相应的规范化。
from rdkit import Chem
from rdkit.Chem import rdMolHash
import rdkit
from pprint import pprint
# View all of the MolHash hashing functions types with the names method.
molhashf = rdMolHash.HashFunction