Python学习④ 随机森林——测试集与训练集的抽取

从excel表中,随机抽取n行记录作为测试集,剩下的作为训练集。

需要进行随机抽取的数据如下图所示(利用pandas读取)共有78行,需从中随机抽取n行作为测试集并输出,剩下的78-n行作为训练集。
被抽取的数据
测试集
训练集

# 从原始数据中取出测试集后,剩下的作为训练集
import pandas as pd
path = r'H:\randomForce.xlsx'    #读取excel文件
data = pd.read_excel(path)
print(data)
n=int(78*0.25)                     #设置抽取个数,0.25表示百分数,需将其转换为整型
test = data.sample(n)              #进行随机抽取n行记录作为测试集
testy = test[:]['y'].index.tolist()
train = data.drop(testy,inplace=False)       #将抽取剩下的作为训练集
test.to_excel('保存路径')
train.to_excel('保存路径')
print("----------测试集------------")
print(test)
print("\n")
print("----------训练集------------")
print(train)
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值