从RDKit的基本用法中看到了化学信息学中使用的各种概念。大多数情况下,流程中处理的化合物数据存储在列表或字典类型变量中,该变量是python或numpy数组的基本数据类型。
另一方面,在使用python进行数据科学和探索性数据分析中,主流是使用pandas Series和DataFrame数据类型。这次,将通过学习如何使用pandas DataFrames处理RDKit Mol对象来填补这一空白。
Pandas
pandas是一个用于处理数据的python库,它是在python数据科学中心提供数据类型以及随之而