Task1
首先是环境配置,通过!pip install
命令进行安装或更新
!pip install pandas
!pip install -U scikit-learn
!pip install rdkit
接着是使用pandas从CSV文件加载数据集
import pickle
import pandas as pd
from tqdm import tqdm
from sklearn.ensemble import RandomForestRegressor
from rdkit.Chem import rdMolDescriptors
from rdkit import RDLogger,Chem
import numpy as np
RDLogger.DisableLog('rdApp.*')
然后是定义函数进行特征提取
实例化并训练RandomForestRegressor模型
接着对测试集的特征向量(test_x)进行预测
预测结果得分: