mysql25001错误,ValueError:找到的样本数量不一致的输入变量:[4,25001]似乎无法识别标头?...

有人知道这是什么问题吗?似乎列名不能识别为标题。下面是我的代码,带有粗体对应的错误。我想编写一个通过将数据集分为训练集和测试集来训练逻辑回归的函数(70%的数据训练和30%的数据用于测试)。先感谢您。

进口

import numpy as np

import pandas as pd

import csv

from sklearn.linear_model import Logistic Regression

from sklearn.metrics import confusion_matrix

from sklearn import tree

from sklearn.linear_model import LogisticRegression

from sklearn.metrics import confusion_matrix

from sklearn.datasets import data

from sklearn.model_selection import train_test_split

加载数据集,在列中分离数据并给出列名:

colnames=["Watermark", "Micro-print", "Ultraviolet fields", "Magnetic fields", "Diameter","Target"]

Dataset=pd.read_csv("/Users/David/Documents/Python Assignment2/data-banknote.csv", sep=',', names=colnames)

Dataset.index=np.arange(1,len(Dataset)+1)

定义TrainData和TestData

TrainData= Dataset["Watermark"],Dataset["Micro-print"],Dataset["Ultraviolet fields"],Dataset["Magnetic fields"],Dataset["Diameter"]

TestData= Dataset["Target"]

显示数据集的标题

TrainData.head()

TestData.head()

给出的错误是TrainData没有标题?

分割数据集

TrainData_train,TrainData_test,TestData_train,TestData_test = train_test_split(TrainData,TestData,test_size=0.3,random_state=0)

ValueError:找到样本数量不一致的输入变量:[4,25001]?

解决方案

暂无回答

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值