机器学习基础--kNN算法

这篇博客介绍了kNN算法的基础知识,通过一个肿瘤数据集来解释算法原理。kNN的思想是计算新样本与所有样本的距离,选取最近的k个邻居,根据多数投票决定新样本的类别。文章详细阐述了kNN的过程,并展示了如何使用自封装和sklearn库实现该算法。
摘要由CSDN通过智能技术生成

一、kNN算法介绍

首先先介绍下kNN算法,有这么一个场景给定了肿瘤块的大小和时间的一组数据,其中每一组数据对应一个结果数据,即恶性还是良性。这么一组数据:

    raw_data_x = [[3.39,2.33],    #特征
                            [3.11,1.78],
                            [1.34,3.37],
                            [3.58,4.68],
                            [2.28,2.87],
                            [7.42,4.7],
                            [5.75,3.53],
                            [9.17,2.51],
                            [7.79,3.42],
                            [7.94,0.79]
                          ]
    raw_data_y=[0,0,0,0,0,1,1,1,1,1] #0良性 1恶性

我们将肿瘤快大小作为横轴,时间作为纵轴,其中绿色代表良性,红色代表恶性,蓝色为给定[8.09,3.37] 需要我们判断是恶性还是良性。

import numpy as np
import matplotlib.pyplot as plt

raw_data_x = [
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值