数据样本，特征值，目标值，按比例划分

最新推荐文章于 2024-01-07 02:04:33 发布

健康平安的活着

最新推荐文章于 2024-01-07 02:04:33 发布

阅读量7.9k

点赞数 8

分类专栏：机器学习

本文链接：https://blog.csdn.net/u011066470/article/details/104447001

版权

机器学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

横着的一行叫数据样本，如

竖着的每一列叫特征值：颜色，形状等列

想要的分类结果，叫目标值，如类别这一列，A,B,C，有3个目标值

#!usr/bin/env python
#-*- coding:utf-8 _*-
'''
@author:Administrator
@file: test.py
https://blog.csdn.net/qq_41797451/article/details/80542060
@time: 2020-02-22 上午 11:23
'''

import pandas as pd
from sklearn.model_selection import train_test_split

data=pd.read_excel("../data/yanben.xls");
print(data)
print(type(data))
#iloc只能用数字索引，不能用索引名
#print(data.iloc[:,0:4])
##loc只能通过index和columns来取，不能用数字
#print(data.loc[0:1,["序号","颜色","形状","重量"]])
#print(data['类别'])
x_data=data.iloc[:,0:4];
x_target=data['类别'];
print(x_data)
print(x_target)
#print(data.descirbe)
#
x_train,x_test,y_train,y_test=train_test_split(x_data,x_target,test_size=0.2)
print("训练集特征值:\n",x_train);
print("训练集目标值:",y_train);
print("====================")
print("测试集特征值:\n",x_test);
print("测试集目标值:",y_test);

序号颜色形状重量类别
0 1 红圆 50 A
1 2 蓝长 20 B
2 3 黄椭圆 2 C
3 4 红方 20 A
4 5 黄长 23 B
<class 'pandas.core.frame.DataFrame'>
序号颜色形状重量
0 1 红圆 50
1 2 蓝长 20
2 3 黄椭圆 2
3 4 红方 20
4 5 黄长 23
0 A
1 B
2 C
3 A
4 B
Name: 类别, dtype: object
训练集特征值:
序号颜色形状重量
3 4 红方 20
0 1 红圆 50
4 5 黄长 23
1 2 蓝长 20
训练集目标值: 3 A
0 A
4 B
1 B
Name: 类别, dtype: object
====================
测试集特征值:
序号颜色形状重量
2 3 黄椭圆 2
测试集目标值: 2 C
Name: 类别, dtype: object

健康平安的活着

关注

8
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
数据样本，特征值，目标值，按比例划分

横着的一行叫数据样本，如竖着的每一列叫特征值：颜色，形状等列想要的分类结果，叫目标值，如类别这一列，A,B,C，有3个目标值#!usr/bin/env python#-*- coding:utf-8 _*-'''@author:Administrator@file: test.pyhttps://blog.csdn.net/qq_41797451/article/det...
复制链接

扫一扫

专栏目录