今天学习了机器学习,机器学习与统计分析有所不同,统计分析是对现有数据的总结、分析、可视化甚至挖掘;而机器学习是从现有数据中找到某种规律,并按此规律对未来的数据做预测。
现在就老师讲解的“数据分类器”的内容及自己的理解做笔记,使用的数据如下:
该表中前26列数据是对调查对象多角度考察的数据记录,最后一列数据是“是否欺诈”的标识,由0和1表示。
机器学习的目标是:使用以上数据训练出一个可以使用的“数据分类器”。
一、 思路
二、 脚本
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import numpy as np
frame = pd.read_csv(r'D:\audit_risk.csv')
c_name = frame.columns[len(frame.columns)-1]
y = frame[c_name]
frame.drop(c_