化学信息学中的模型构建
- 将分子转换为特征向量(编码)
- 描述特征向量与目标分子特性(映射)之间的关系
K最近邻(kNN,k-NearestNeighbor)
- 将数据集放置在特征空间中(学习)
- 根据k个相邻数据点的值确定新点的值(预测)
- 当k = 1时:它被归类为“红色”以及最接近的红点。
- 当k = 3时,最接近的三个点是红色2蓝色1,并以多数票被归类为“红色”。
- 当k = 5时:最接近的五个点是红色2蓝色3,并且按多数票被分类为“蓝色”。
以这种方式更改k的值会更改结果,因此k值是k最近邻方法中最重要的参数。