使用NumPy和Pandas制作数据集

这篇博客介绍了如何利用NumPy和Pandas生成随机数据,并将其转化为适合回归模型的数据集。通过设置随机种子,生成numpy数组,然后转换为DataFrame,添加列名,再划分特征和目标变量。最后,用PLSRegression模型进行训练和预测,展示了数据准备和模型应用的基本流程。
摘要由CSDN通过智能技术生成

使用NumPy和Pandas制造临时性数据练习回归类模型

首先 这个不用介绍

import numpy as np

import pandas as pd

然后

np.random.seed( 9 ) #设置随机种子

a = np.random.randn( 5, 7 ) #生成你想要的形状的随机数据

a

在这里插入图片描述
注意 此时的数据类型是numpy.ndarray

下一步 把ndarray转换成了dataframe

a = pd.DataFrame( a )

a.head()

下一步 添加列名

a.columns = [ “x1”, “x2”, “x3”, “x4”, “x5”, “y1”, “y2” ]

a.head()

在这里插入图片描述
下一步 划分x和y

x = a.drop( [ ‘y1’, ‘y2’ ], axis = 1 )

x.head()

y = a.drop( [ ‘x1’, ‘x2’, ‘x3’, ‘x4’, ‘x5’ ], axis = 1 )

y.head()

至此 数据准备完成 你已经无中生有了一套数据

然后 以大名鼎鼎的PLSR为例

from sklearn.cross_decomposition import PLSRegression

plsr = PLSRegression( n_compo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值