ValueError: X has 597 features, but SVC is expecting 605 features as input.

使用训练好的sklearn svm.SVC的模型,去对测试数据预测的时候报错了
2022/04/11

  • 代码:
tfidfTrain = TfidfVectorizer(stop_words=stopWordList
                             ,min_df= 0.02
                            ).fit_transform(dataTrain_list)

tfidfTest = TfidfVectorizer(stop_words=stopWordList
                            ,min_df= 0.02
                            ,max_features = 605 #之前没加也是同样的报错
                            #觉得是训练集和测试集的特征数量不一样才报错,
                            #打算控制测试集的特征和训练集一样,
                            #结果还是报错
                           ).fit_transform(dataTest_list)

#用训练集训练模型
model = OneVsRestClassifier(svm.SVC(kernel='linear'))
clf = model.fit(tfidfTrain, labelTrain_list)

ytest_pred = clf.predict(tfidfTest)
  • 报错:
    ValueError: X has 597 features, but SVC is expecting 605 features as input.
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-14-8d3a4697f978> in <module>()
     30 
     31 print("对测试集进行模型评估:")
---> 32 ytest_pred = clf.predict(tfidfTest)
     33 print("classification_report: ")
     34 print(classification_report(labelTest_list, ytest_pred))

~\AppData\Roaming\Python\Python37\site-packages\sklearn\multiclass.py in predict(self, X)
    441             argmaxima = np.zeros(n_samples, dtype=int)
    442             for i, e in enumerate(self.estimators_):
--> 443                 pred = _predict_binary(e, X)
    444                 np.maximum(maxima, pred, out=maxima)
    445                 argmaxima[maxima == pred] = i

~\AppData\Roaming\Python\Python37\site-packages\sklearn\multiclass.py in _predict_binary(estimator, X)
     98         return estimator.predict(X)
     99     try:
--> 100         score = np.ravel(estimator.decision_function(X))
    101     except (AttributeError, NotImplementedError):
    102         # probabilities of the positive class

~\AppData\Roaming\Python\Python37\site-packages\sklearn\svm\_base.py in decision_function(self, X)
    754         transformation of ovo decision function.
    755         """
--> 756         dec = self._decision_function(X)
    757         if self.decision_function_shape == "ovr" and len(self.classes_) > 2:
    758             return _ovr_decision_function(dec < 0, -dec, len(self.classes_))

~\AppData\Roaming\Python\Python37\site-packages\sklearn\svm\_base.py in _decision_function(self, X)
    512         # NOTE: _validate_for_predict contains check for is_fitted
    513         # hence must be placed before any other attributes are used.
--> 514         X = self._validate_for_predict(X)
    515         X = self._compute_kernel(X)
    516 

~\AppData\Roaming\Python\Python37\site-packages\sklearn\svm\_base.py in _validate_for_predict(self, X)
    596                 order="C",
    597                 accept_large_sparse=False,
--> 598                 reset=False,
    599             )
    600 

~\AppData\Roaming\Python\Python37\site-packages\sklearn\base.py in _validate_data(self, X, y, reset, validate_separately, **check_params)
    583 
    584         if not no_val_X and check_params.get("ensure_2d", True):
--> 585             self._check_n_features(X, reset=reset)
    586 
    587         return out

~\AppData\Roaming\Python\Python37\site-packages\sklearn\base.py in _check_n_features(self, X, reset)
    399         if n_features != self.n_features_in_:
    400             raise ValueError(
--> 401                 f"X has {n_features} features, but {self.__class__.__name__} "
    402                 f"is expecting {self.n_features_in_} features as input."
    403             )

ValueError: X has 597 features, but SVC is expecting 605 features as input.

还没好好看源码,先记录一下

2022/04/12:

  • 解决:

把测试数据的fit_transform()改为transform()就可以了把测试数据的fit_transform()改为transform()就可以了

查找解决方法过程:

  • 11
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
### 回答1: 这个错误提示是因为你的决策树分类器期望输入的特征数量为30,但是你提供的特征数量只有29个。可能原因有: 1. 数据集中缺少一列特征数据。 2. 在训练模型时,你使用了不同的特征集。 3. 在数据预处理过程中,你可能意外删除了一列特征数据。 解决方法: 1. 检查你的数据集,确保每一列特征数据都包含在内。 2. 检查你的代码,确保在训练和测试模型时使用的特征集相同。 3. 如果你在数据预处理过程中删除了某一列特征数据,可以从原始数据集中重新获取该列数据。 ### 回答2: 这个错误是因为DecisionTreeClassifier模型要求输入的特征数为30,但输入的数据X的特征数为29。解决这个问题的方法有以下几种: 1. 检查输入数据的维度: 可能是数据集中的一个样本缺少一个特征值,可以检查一下数据集是否有缺失值或者某些样本的特征值是否提取错误。可以通过打印数据X的shape属性,确认特征的数量是否正确。 2. 数据预处理: 如果发现确实缺少一个特征值,可以考虑对数据进行预处理。可以使用填充函数(如sklearn中的SimpleImputer)来填充缺失值,或者删除缺失值较多的样本。 3. 检查模型参数: 检查DecisionTreeClassifier模型的参数设置是否正确。可能是由于模型的参数设置不正确,导致模型期望的特征数与实际特征数不一致。可以查看模型参数的文档,确认参数设置是否正确。 4. 检查特征工程的过程: 在进行数据预处理、特征提取时,可能存在一些错误导致特征数量不一致。可以检查特征提取的代码,确保特征提取的过程正确无误。 综上所述,解决此错误可以仔细检查数据集的特征数量、数据预处理过程、模型参数设置和特征工程过程,找出导致特征数量不一致的原因并进行相应的调整。 ### 回答3: 这个错误说明了在使用决策树分类器(DecisionTreeClassifier)时,输入的数据特征数量与期望的不一致。 在这个问题中,X是用于训练和测试决策树分类器的数据集,它具有29个特征。然而,决策树分类器期望的输入应该包含30个特征。 为了解决这个问题,我们应该检查数据集中特征的数量是否与模型期望的一致。 有几种方法可以处理这个问题: 1. 使用具有30个特征的数据集:我们可以尝试找到或创建一个具有30个特征的数据集,以便与决策树分类器的期望输入相匹配。 2. 删除不必要的特征:我们可以检查数据集中的特征,看看是否有不必要或冗余的特征。如果有的话,我们可以选择删除它们,从而减少特征数量。 3. 添加额外的特征:如果我们认为决策树分类器需要更多的特征来更好地进行分类,我们可以尝试添加一些相关特征。这可以通过特征工程的方法来实现。 需要注意的是,这只是一个简单的概述,可能需要根据具体情况进行调整。了解决决策树分类器预期输入特征数量的问题后,您可以采取适当的步骤来解决该错误。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

a_Yogurt

你的鼓励就是最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值