数学建模国赛:python机器学习基础之训练集和测试集拆分、算法精确率评估

在实际训练中,经常会把训练数据进一步拆分成训练集和测试集这样有助于模型选取。

想要数据集或者有不明白的请点赞关注后私信博主

Sklearn中的train_test_spilt函数是交叉验证常用的函数,功能是从样本中随机地按比例选取训练集和测试集

原数据如下:

拆分后效果如下

 

 ton代码如下

from sklearn import  preprocessing
from sklearn.model_selection import  train_test_split
import pandas as pd

import  numpy as np
data1=pd.read_csv(r'CatInfo.csv',",")
print(data1)
df=pd.DataFrame(data1)
car_train_x,cat_test_x,cat_train_y,cat_test_y=train_test_split(df['Lwsk'],df['LEar'],test_size=0.3,random_state=0)
print('trainx\n',car_train_x)
print('trainy\n',cat_train_y)
print('testx\n',cat_test_x)
print('testy\n',cat_test_y)

同样地 对训练出来的结果进行精确率的评估也是非常重要的sklearn里同样提供里评估的函数

具体评估因子有 1:精确率 2:召回率 3:F-measure指数等等

效果图如下

 

代码如下

from sklearn.metrics import classification_report
y_true=[0,1,2,2,2]

y_pred=[0,0,2,2,1]
print(classification_report(y_true,y_pred))

 

 想要数据集或者有不明白的请点赞关注后私信博主

 

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

showswoller

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值