sklearn中数据集与xlsx文件的互转

没用过pandas库的直接用sklearn库想必会一脸懵逼:训练的数据明明保存在xlsx文件当中,该如何变成sklearn可用的数据集呢?于是针对y在最后一列的情况,写了下面两个通用模板……

(以玩具数据集iris为例,实际运用中只需修改lst1和lst2,兼容方便)

将数据集转存为xlsx文件:

import pandas as pd
import numpy as np
from sklearn import datasets
iris = datasets.load_iris()

lst1, lst2 = iris.data, iris.target#lst1是训练集中的x,lst2是训练集中的y
xi = ['x'+str(i+1) for i in range(len(lst1[0]))]
df = pd.DataFrame(lst1, columns=xi)
df['y'] = lst2
df.to_excel("try2.xlsx", index=False)

将xlsx文件读取成需要的数据集:

df = pd.read_excel('try2.xlsx')
# 行列互换
df2 = df.stack()
df3 = df2.unstack(0)
#
lst = df3.values.tolist()  # 转列表
lst1, lst2 = lst[:-1], lst[-1]
data, target = lst1, lst2
print(data)
print(target)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值