本节对上一节机器学习 -- KNN算法(肿瘤预测案例)在jupyter中的代码修改为函数式实现。
(1)首先导入所有需要的模块和包:
import numpy as np
from collections import Counter
(2)导入数据集的函数实现:
def loadData():
"""
加载数据集(这里只是通过手动的方式构造数据集,之后会使用文件读取的方式)
:return: 训练集的特征值X_train的numpy数组, 训练集的目标值y_train的numpy数组
"""
raw_data_X = [[3.3935, 2.3312],
[3.1101, 1.7815],
[1.3438, 3.3684],
[3.5823, 4.6792],
[2.2804, 2.8670],
[7.4234, 4.6965],
[5.7451, 3.5340],
[9.1722, 2.5111],
[7.7928, 3.4241],
[7.9398, 0.7916]]
raw_data_y = [0, 0, 0, 0, 0, 1, 1, 1, 1, 1]
X_train