**《 机器学习 》朴素贝叶斯 ValueError: Expected 2D array, got 1D array instead: array=[7 8 6 ... 4 8 7]. Reshap

《 机器学习 》朴素贝叶斯 ValueError: Expected 2D array, got 1D array instead: array=[7 8 6 … 4 8 7]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.解决方法

一、Sklearn 中的相关函数的基本介绍
在 scikit-learn 中,一共有 3 个朴素贝叶斯的分类算法类:
GaussianNB:先验为高斯分布的朴素贝叶斯
MultinomialNB:先验为多项式分布的朴素贝叶斯
BernoulliNB:先验为伯努利分布的朴素贝叶斯
这三个类适用的分类场景各不相同:
一般来说,如果样本特征的分布大部分是连续值,使用 GaussianNB 会比较好;
如果如果样本特征的分大部分是多元离散值,使用 MultinomialNB 比较合适;
如果样本特征是二元离散值或者很稀疏的多元离散值,应该使用 BernoulliNB。

二、问题及解决
1、问题
(1)源码:

gnb=GaussianNB().fit(trainX,trainY)
mnb=MultinomialNB().fit(trainX,trainY)

(2)报错:
ValueError: Expected 2D array, got 1D array instead:
array=[7 8 6 … 4 8 7].
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
2、解决
(1)改正代码:

gnb=GaussianNB().fit(trainX.reshape(-1,1),trainY.reshape(-1,1))
mnb=MultinomialNB().fit(trainX.reshape(-1,1),trainY.reshape(-1,1))

(2)解释:
scikit-learn新版本中所有东西都必须是一个2D矩阵,即使是一个简单的column或row,因此,我们在使用python3实现与此相关的操作时,使用array.reshape(-1, 1)或array.reshape(1,-1)重新调整你的数据 。
若数据只有一个特征描述时,使用array.reshape(-1, 1);
【由于我做的实验目的是:利用自带的手写数字数据集,测试高斯朴素贝叶斯和多项式朴素贝叶斯的精度,并绘制学习曲线对比两种学习曲线的学习效果。因此,采用array.reshape(-1, 1)调整数据】
若数据只包含一个样本时,使用array.reshape(1, -1) 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值