python predict y和x是必须一致吗_python – ValueError：x和y必须大小相同

最新推荐文章于 2022-08-09 16:01:00 发布

weixin_39897267

最新推荐文章于 2022-08-09 16:01:00 发布

阅读量209

点赞数

文章标签： python predict y和x是必须一致吗

import numpy as np

import pandas as pd

import matplotlib.pyplot as pt

data1 = pd.read_csv('stage1_labels.csv')

X = data1.iloc[:, :-1].values

y = data1.iloc[:, 1].values

from sklearn.preprocessing import LabelEncoder, OneHotEncoder

label_X = LabelEncoder()

X[:,0] = label_X.fit_transform(X[:,0])

encoder = OneHotEncoder(categorical_features = [0])

X = encoder.fit_transform(X).toarray()

from sklearn.cross_validation import train_test_split

X_train, X_test, y_train,y_test = train_test_split(X, y, test_size = 0.4, random_state = 0)

#fitting Simple Regression to training set

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()

regressor.fit(X_train, y_train)

#predecting the test set results

y_pred = regressor.predict(X_test)

#Visualization of the training set results

pt.scatter(X_train, y_train, color = 'red')

pt.plot(X_train, regressor.predict(X_train), color = 'green')

pt.title('salary vs yearExp (Training set)')

pt.xlabel('years of experience')

pt.ylabel('salary')

pt.show()

执行上面的代码时,我需要帮助理解错误.以下是错误：

“引发ValueError(”x和y必须大小相同“)”

我有.csv文件,包含1398行和2列.我将y_test设置为40％,因为它在上面的代码中可见.

请帮忙

问候,

Amitesh

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注