有用的代码整理

一、KNN

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np


def knn(inputX, data, lable, tempK):
    # 1. 获取数据集的个数
    m = len(lable)
    # 2. 根据测试数据构建 m*1 的矩阵
    diffMat = np.tile(inputX, (m, 1))
    # 3. 求欧式距离
    distance = ((data - diffMat) ** 2).sum(axis=1) ** 0.5
    # 4. 从小到大按行排列, 返回排列之前对应的索引
    sortedIndex = distance.argsort(axis=0)
    # 5. 找到前 K 个数据的类别
    lables = []
    for i in range(0, tempK):
        lables.append(lable[sortedIndex[i]])
    # 6. 统计每个类别的数量
    count = {}
    for lable in lables:
        count[lable] = count.get(lable, 0) + 1
    # 7. 获取频次最多的类别,并返回
    return max(count, key=count.get)


# 1. 读取鸢尾花数据
iris = load_iris()

# 2. 交叉验证,将数据按照 3/1 分为训练数据,测试数据
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25)

# 3. 读取训练数据
train_data = np.array(x_train)
train_lable = np.array(y_train)

# 4. 根据标签对训练数据进行分类
A, B, C = [], [], []
for idx in range(0, len(train_lable)):
    if train_lable[idx] == 0:
        A.append(train_data[idx])
    elif train_lable[idx] == 1:
        B.append(train_data[idx])
    else:
        C.append(train_data[idx])
A, B, C = np.array(A), np.array(B), np.array(C)

# 5. 读取测试数据
test_data = np.array(x_test)
test_lable = np.array(y_test)

# 6. 使用 KNN 分类器进行分类预测
for idx in range(0, len(test_lable)):
    ret = knn(test_data[idx], train_data, train_lable, 3)
    if ret == test_lable[idx]:
        print('预测正确')
    else:
        print('预测错误')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

写代码的不谷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值