python knn模型_使用Python训练KNN模型并进行分类

本文介绍了如何在Python中使用sklearn库构建KNN(K-Nearest Neighbor)模型,通过贷款金额和用户收入对贷款状态进行分类。首先,导入所需的库,如sklearn、numpy和pandas。接着,读取数据并创建数据表,通过散点图观察特征关系。然后,设置模型的自变量和因变量,将数据划分为训练集和测试集。最后,训练模型,测试其准确率,并对新数据进行预测。
摘要由CSDN通过智能技术生成

K临近分类算法是数据挖掘中较为简单的一种分类方法,通过计算不同数据点间的距离对数据进行分类,并对新的数据进行分类预测。我们在之前的文章《K邻近(KNN)分类和预测算法的原理及实现》和《协同过滤推荐算法的原理及实现》两篇文章中都详细介绍过。本篇文章将介绍在python中使用机器学习库sklearn建立K临近模型(k-NearestNeighbor)的过程并使用模型对数据进行预测。

准备工作

首先是开始前的准备工作,导入我们需要使用的库文件。这里一共需要使用5个库文件。第一个是机器学习库,第二个是用于模型检验的交叉检验库,第三个是数值计算库,第四个是科学计算库,最后是图表库。

#导入机器学习KNN分析库

from sklearn.neighbors import KNeighborsClassifier

#导入交叉验证库

from sklearn import cross_validation

#导入数值计算库

import numpy as np

#导入科学计算库

import pandas as pd

#导入图表库

import matplotlib.pyplot as plt

读取并查看数据表

读取并导入所需数据,创建名为knn_data的数据表,后面我们将使用这个数据对模型进行训练和检验。

#读取并创建名为knn_data的数据表

knn_data=pd.DataFrame(pd.read_csv('knn_data.csv'))

使用head函数查看数据表的内容,这里只查看前5行的数据,数据表中包含三个字段,分别

  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值