监督式学习,由已有的数据包括输入输出,训练模型函数;然后把新的输入数据带入模型函数,预测数据输出;函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)
使用knn算法
样本:
样本拥有两类,一部分是训练样本,一部分是测试样本,
可以从文本中大概看出这是数字0,以0和1 表示,文件名‘-’前表示数字内容,后面表示样本的名字
一,处理样本
import pandas as pd
import numpy as np
import os
import re
import time
#创建一个空DataFrame columns = [0,1...1023,'type']
a = [ i for i in ra