【python】【codelet】从csv文件读出样本集,分割好准备训练

# Step 1) 样本准备
# -----------------------------------------------------

import pandas as pd;

# 1-1) 从csv导入样本集
strModelIdx = "allClass";
netFlow_data = pd.read_csv(filepath_or_buffer=args.input+'.csv');
print("Sample set size:", netFlow_data.shape);

# 1-2) 取出特征部分,和标签部分
X = netFlow_data[['F00','F01','F02','F03','F04','F20','F21','F22','F23','F24','F25','F26','F27','F28','F29','F30','F31','F32','F33','F34','F35','F36','F37','F38','F39']];
y = netFlow_data[['CLASS']];
#print( X, y );

# 1-3) 划分训练集和测试集
from sklearn.model_selection import train_test_split;
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1);
print("Train set size, Test set size:",X_train.shape, y_train.shape, X_test.shape, y_test.shape);
# =======================================================


# 怎么转换成 numpy
y_train.to_numpy();

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值