将数据集按特征|列分割为解释变量 X & 响应变量 y 的几种方法【机器学习】

来杯Sherry

已于 2023-06-29 15:46:03 修改

阅读量1.1k

点赞数 2

分类专栏：机器学习 Python 文章标签：机器学习回归数据挖掘

于 2022-02-26 16:18:24 首次发布

本文链接：https://blog.csdn.net/weixin_44041700/article/details/123151399

版权

Python 同时被 2 个专栏收录

45 篇文章 2 订阅

订阅专栏

机器学习

13 篇文章 0 订阅

订阅专栏

在这里插入图片描述

文章目录

1、波士顿房价预测

1.1、特点

回归问题，解释变量唯一
利用整数下标

1.2、代码

from pandas import read_csv

dataset =read_csv('train.csv').values
X = dataset[:,0:13]
Y = dataset[:,13]

波士顿房价预测
特点：回归问题，解释变量唯一

利用条件

from pandas import read_csv

dataset =read_csv('train.csv')
X = X = dataset.iloc[:, dataset.columns != "price"]
Y = dataset[:,dataset.columns == "price"]

2、船舶航行轨迹预测

2.1、特点

回归问题，解释变量为 lat lon

2.2、代码

from pandas import read_csv

dataset =read_csv('train.csv')
# mmsi	lat	lon	Sog	Cog	timestamp
#dataset.iloc[行,列]
#这里指  [所有行，bool]     
X = dataset.iloc[:, [True,False,False,True,True,True]]
Y = dataset.iloc[:, [False,True,True,False,False,False]]

2.3、TIP

这里的列，根据bool/条件语句/整数去选择列都可以，比如
X = dataset.iloc[:, dataset.columns != "lat"]
上面的只适合一元响应变量的特征输入，很可惜写成下面这样就无法通过编译了
X = dataset.iloc[:, dataset.columns != "lat" and  dataset.columns != "lon"]
原因如下上面提到的双条件判断出现了[True,False,False,True,True,True]与[False,True,True,False,False,False]判断，出现了多组值的判断

来杯Sherry

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
将数据集按特征|列分割为解释变量 X & 响应变量 y 的几种方法【机器学习】

原因如下上面提到的双条件判断出现了[True,False,False,True,True,True]与[False,True,True,False,False,False]判断，出现了多组值的判断。上面的只适合一元响应变量的特征输入，很可惜写成下面这样就无法通过编译了。这里的列，根据bool/条件语句/整数去选择列都可以，比如。特点：回归问题，解释变量唯一。回归问题，解释变量为。
复制链接

扫一扫