从excel表中,随机抽取n行记录作为测试集,剩下的作为训练集。
需要进行随机抽取的数据如下图所示(利用pandas读取)共有78行,需从中随机抽取n行作为测试集并输出,剩下的78-n行作为训练集。
# 从原始数据中取出测试集后,剩下的作为训练集
import pandas as pd
path = r'H:\randomForce.xlsx' #读取excel文件
data = pd.read_excel(path)
print(data)
n=int(78*0.25) #设置抽取个数,0.25表示百分数,需将其转换为整型
test = data.sample(n) #进行随机抽取n行记录作为测试集
testy = test[:]['y'].index.tolist()
train = data.drop(testy,inplace=False) #将抽取剩下的作为训练集
test.to_excel('保存路径')
train.to_excel('保存路径')
print("----------测试集------------")
print(test)
print("\n")
print("----------训练集------------")
print(train)