python dtype o_Scipy hstack导致“TypeError:类型不支持转换:(dtype('float64'),dtype('O'))”...

我试图运行hstack将一列整数值连接到一个由TF-IDF创建的列列表(这样我最终可以在分类器中使用所有这些列/特性)。

我正在使用pandas阅读专栏,检查任何NA值并将其转换为数据帧中的最大值,如下所示:OtherColumn = p.read_csv('file.csv', delimiter=";", na_values=['?'])[["OtherColumn"]]

OtherColumn = OtherColumn.fillna(OtherColumn.max())

OtherColumn = OtherColumn.convert_objects(convert_numeric=True)

然后我在文本栏中阅读并运行TF-IDF以创建大量功能:X = list(np.array(p.read_csv('file.csv', delimiter=";"))[:,2])

tfv = TfidfVectorizer(min_df=3, max_features=None, strip_accents='unicode',

analyzer='word',token_pattern=r'\w{1,}',ngram_range=(1, 2), use_idf=1,smooth_idf=1,sublinear_tf=1)

tfv.fit(X)

最后,我想把它们结合在一起,这就是我们的错误发生的地方,程序无法运行,而且我不确定我是否在这里适当地使用了标准缩放器:X = sp.sparse.hstack((X, OtherColumn.valu

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值