从许多化合物构建结构多样的化合物库:
- 聚类方法
- 基于距离的方法
- 基于分类的方法
- 使用优化方法的方法
通过使用Ward方法进行聚类从化合物库中选择“各种”化合物,Ward方法是分层聚类方法之一。
导入库
from rdkit import rdBase, Chem, DataStructs
from rdkit.Chem import AllChem
from rdkit.Chem.Draw import rdMolDraw2D, IPythonConsole
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import AgglomerativeClustering
%matplotlib inline
print(rdBase.rdkitVersion)