python vec什么意思,在wordvec方法Python中包含分类特性和文本

我的数据混合了文本和分类特征。它看起来像:cr_id description business type status

1 More robust system required secured loan system rejected

2 More robust system required secured loan system rejected

3 grant access to all products mortgage system rejected

4 EDAP Scenario secured loan regulatory accepted

5 grant access to all products secured loan regulatory accepted

现在在“描述”栏中,我将应用word2vec方法。结果我得到了一个300列的训练向量。现在我的问题是如何在模型中包含分类特征。我的意思是如何组合word2vec的输出和一个热编码向量,因为它们是不同的形状。代码用于形成wordvec的是:

^{pr2}$

现在我可以将这些训练的数据用于任何分类器来预测状态。现在,如上所述,我很困惑如何包括/附加分类胎儿,如类型和训练的数据,因为它们是不同的形状。在

编辑:为了更好地理解问题,trainedDatavecs如下所示:array([[-0.02591809, -0.04678563, -0.0401891 , ..., -0.00907444,

-0.02070936, -0.02332937],

[ 0.00098296, -0.00293253, 0.04667222, ..., 0.00685261,

-0.01234391, -0.03822058],

[ 0.01843361, -0.01345504, -0.01359649, ..., -0.04710409,

0.04892955, 0.02135875],

...,

[ 0.0304883 , 0.08515919, 0.01928426, ..., -0.00903708,

-0.00333895, 0.07550056],

[ 0.01843361, -0.01345504, -0.01359649, ..., -0.04710409,

0.04892955, 0.02135875],

[ 0.01843361, -0.01345504, -0.01359649, ..., -0.04710409,

0.04892955, 0.02135875]], dtype=float32)

其维数为(40,300),输入的训练数据的维数为(40,5)。300列来自于features参数的数量。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值