【Python】解决Python报错：ValueError: Found input variables with inconsistent numbers of samples: [86, 891]

最新推荐文章于 2024-07-16 08:23:38 发布

I'mAlex

最新推荐文章于 2024-07-16 08:23:38 发布

阅读量1.2k

点赞数 26

文章标签： python 开发语言

本文链接：https://blog.csdn.net/g310773517/article/details/139474641

版权

程序bug报错解决方案合集专栏收录该内容

214 篇文章

订阅专栏

🧑 博主简介：阿里巴巴嵌入式技术专家，深耕嵌入式+人工智能领域，具备多年的嵌入式硬件产品研发管理经验。

📒 博客介绍：分享嵌入式开发领域的相关知识、经验、思考和感悟，欢迎关注。提供嵌入式方向的学习指导、简历面试辅导、技术架构设计优化、开发外包等服务，有需要可加文末联系方式联系。

💬 博主粉丝群介绍：① 群内高中生、本科生、研究生、博士生遍布，可互相学习，交流困惑。② 热榜top10的常客也在群里，也有数不清的万粉大佬，可以交流写作技巧，上榜经验，涨粉秘籍。③ 群内也有职场精英，大厂大佬，可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份，助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本，送真活跃粉丝，助你提升文章热度。有兴趣的加文末联系方式，备注自己的CSDN昵称，拉你进群，互相学习共同进步。

在这里插入图片描述

解决Python报错：ValueError: Found input variables with inconsistent numbers of samples: [86, 891]

在这里插入图片描述

问题背景

ValueError: Found input variables with inconsistent numbers of samples: [86, 891] 错误通常发生在使用机器学习模型时，输入数据的样本数量不一致。例如，当你尝试使用 scikit-learn 进行模型训练、预测或交叉验证时，特征矩阵和标签数组的长度不一致会导致这个错误。

错误示例代码与详细报错内容

错误示例代码：

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 示例数据
X = np.random.rand(86, 10)  # 特征矩阵，86 个样本，10 个特征
y = np.random.randint(0, 2, size=891)  # 标签数组，891 个样本

# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 拟合模型
model = LogisticRegression()
model.fit(X_train, y_train)

完整报错内容：

ValueError: Found input variables with inconsistent numbers of samples: [86, 891]

解决方案

1. 检查输入数据的形状

确保特征矩阵 (X) 和标签数组 (y) 的样本数量一致。特征矩阵的行数应该等于标签数组的大小。

检查方法示例：

print(X.shape)  # 输出特征矩阵的形状
print(y.shape)  # 输出标签数组的形状

2. 修正输入数据的大小

确保在准备输入数据时，特征矩阵和标签数组的样本数量匹配。

错误示例：

# 特征矩阵和标签数组的样本数量不一致
X = np.random.rand(86, 10)
y = np.random.randint(0, 2, size=891)

解决方法：

# 确保特征矩阵和标签数组的样本数量相同
X = np.random.rand(891, 10)
y = np.random.randint(0, 2, size=891)

3. 数据整理和预处理

在完成数据清洗和预处理之后，检查数据的一致性。确保在拆分数据集前特征矩阵和标签数组是对齐的。

示例代码：

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 示例数据
X = np.random.rand(891, 10)  # 特征矩阵，891 个样本，10 个特征
y = np.random.randint(0, 2, size=891)  # 标签数组，891 个样本

# 检查数据形状
print("X shape:", X.shape)
print("y shape:", y.shape)

# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 拟合模型
model = LogisticRegression()
model.fit(X_train, y_train)

# 预测和评估
y_pred = model.predict(X_test)
print("Predictions:", y_pred)

总结

ValueError: Found input variables with inconsistent numbers of samples: [86, 891] 错误通常是由于特征矩阵和标签数组的样本数量不一致导致的。你可以通过检查输入数据的形状、修正输入数据的大小以及在数据整理和预处理之后再确保数据一致来解决这个问题。

希望本文对你理解和解决 ValueError: Found input variables with inconsistent numbers of samples: [86, 891] 错误有所帮助。如果你有任何问题或建议，欢迎在评论区留言讨论！、