pyspark dataframe vector转array 保存到csv文件

ROBOT玲玉

于 2023-09-21 16:23:50 发布

阅读量422

点赞数

文章标签：算法 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/malingyu/article/details/133136530

版权

test_df.printSchema()

root
|-- features: vector (nullable = true)
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)

vector_udf = F.udf(lambda vector: vector.toArray().tolist(), ArrayType(FloatType()))
flattened_df = test_df.withColumn('col1', vector_udf('features'))

flattened_df.printSchema()

root
|-- features: vector (nullable = true)
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)
|-- col1: array (nullable = true)
| |-- element: float (containsNull = true)

list4tojson = ['col1']
#保存文件
flattened_df.select('output', *[F.to_json(x) for x in list4tojson]).coalesce(1).write.csv('test_001.csv')

save_df=flattened_df.select('output',"prediction", *[F.to_json(x) for x in list4tojson])

save_df.printSchema()

root
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)
|-- to_json(col1): string (nullable = true)

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pyspark dataframe vector转array 保存到csv文件

【代码】pyspark dataframe vector转array 保存到csv文件。
复制链接

扫一扫

ROBOT玲玉 CSDN认证博客专家 CSDN认证企业博客

码龄11年

90: 原创

5万+: 周排名

2万+: 总排名

23万+: 访问

: 等级

2567: 积分

41: 粉丝

78: 获赞

33: 评论

336: 收藏

私信

关注

热门文章

分类专栏

.net 3篇
docbook 2篇
nginx 4篇
jenkins 4篇
node 4篇
jira 1篇
K8s 1篇
consul
網關 1篇
nodejs 1篇
opencv for android 6篇
android ndk
java 5篇
spark 6篇
python 10篇
spark，python 1篇
mysql 14篇
虚拟机 1篇
机器学习 1篇
Ubuntu 21篇
InfluxDB 1篇
docker 15篇
ros 3篇
c++ 9篇
eclipse 1篇
微服务 1篇

最新评论

PySpark 线性回归
§◇◆◇◆End.332: 数据集可以发一下吗
1.centos7 安装显卡驱动、cuda、cudnn
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
OptaPlanner Spring Boot Java快速启动
qq_15729315: 我最近也在看这个但是我如果想实现一下约束应该怎么处理呢 1、每个老师每天最多排4节课 2、每个班级的每个学科每天最多排2节课 3、每个班级每个学科的课程尽量平均分到每天（比如语文6节，应该是每天一节，有一天2节，而不是每天2节，3天就排完了）
Ubuntu mysql8.0忘记root密码
ROBOT玲玉: 先按照步骤1修改好文件之后，要重启mysql的
Ubuntu mysql8.0忘记root密码
NUAA_CX: 博主您好我在mysql -u root -p这一步之后输密码会报错： ERROR 2003 (HY000): Can't connect to MySQL server on 'localhost:3306' (111) 能方便解答一下疑惑吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。