tf 如何进行svd_如何在pysp的TFIDF数据帧上应用SVD

我已经应用了pyspark tf idf函数并得到了以下结果。在| features |

|----------|

| (35,[7,9,11,12,19,26,33],[1.2039728043259361,1.2039728043259361,1.2039728043259361,1.6094379124341003,1.6094379124341003,1.6094379124341003,1.6094379124341003]) |

| (35,[0,2,4,5,6,11,22],[0.9162907318741551,0.9162907318741551,1.2039728043259361,1.2039728043259361,1.2039728043259361,1.2039728043259361,1.6094379124341003]) |

因此,一个数据帧有1列(features),其中包含sparsevector作为行。在

我尝试过以下方法,但没有成功:

^{pr2}$

我使用RowMatrix是因为要构建它,我不需要提供元组,但我甚至不能构建RowMatrix。IndexedRowMatrix对我来说会更困难。在

那么如何在pyspark中tf-idf数据帧的输出上运行indexedrowmmatrix?在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值