spark保存取数结果为csv文件技巧

最新推荐文章于 2023-09-21 16:23:50 发布

qq_34669699

最新推荐文章于 2023-09-21 16:23:50 发布

阅读量768

点赞数

分类专栏：大数据个人笔记文章标签： spark excel 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34669699/article/details/129300204

版权

个人笔记同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

问题

生成的取数结果含有纯数字，在保存为csv文件并用Excel或WPS查看结果时，数字会以科学表达式，或Excel默认的单元格格式展示，非常的不友好
在这里插入图片描述

描述

在通过pyspark脚本，按需求清洗（按条件筛选）、聚合（按日期、月份进行分组）后，得到的数据，通常会包含纯数字的用户id(如 05912000003186)或者编码code（如 00600637000000010000000007149945变为6.00637E+29）,同时调整单元格格式又找不到符合的格式

原数据	Excel展示数据
00600637000000010000000007149945	6.00637E+29

方法

在纯数字的末尾添加tab制表符（转义字符 ‘\t’）

import pyspark.sql.functions as F
df = df.select('user_id','code')
df1 = df.withColumn("sep", F.lit("\t"))
data = df1.withColumn("new_code", F.concat(df1.code, df1.sep))

结果如下图
在这里插入图片描述
Excel上展示效果

这样就可以巧妙的避免Excel自动处理纯数字的数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark保存取数结果为csv文件技巧

生成的取数结果含有纯数字，在保存为csv文件并用Excel或WPS查看结果时，数字会以科学表达式，或Excel默认的单元格格式展示，非常的不友好。
复制链接

扫一扫

专栏目录

qq_34669699 CSDN认证博客专家 CSDN认证企业博客

码龄8年

12: 原创

48万+: 周排名

170万+: 总排名

1万+: 访问

: 等级

200: 积分

1: 粉丝

1: 获赞

4: 评论

12: 收藏

私信

关注

热门文章

分类专栏

大数据 7篇
个人笔记 8篇
前端 1篇

最新评论

时间戳的唯一性生成
CSDN-Ada助手: 恭喜您写下了第11篇博客！标题“时间戳的唯一性生成”听起来非常有趣。在这个快节奏的数字时代，确保生成唯一的时间戳对于许多应用程序来说都是至关重要的。我很高兴看到您对这个主题进行了深入研究和探讨。接下来，我想提出一个谦虚的创作建议。在您的下一篇博客中，您可以考虑探讨如何在不同编程语言或框架中实现时间戳的唯一性生成。这将帮助更多的读者从不同的技术背景中获得启发和实用的指导，使您的博客更具广泛的适用性。继续保持创作，并期待您未来更多有趣和有见地的博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply11 看奖励名单。
cdh6.1.0的环境安装kylin2.6.4
su553766255: 解决了吗？
CDH6.1.0环境安装kylin2.6.4 遇到的问题
11号车厢: 大哥，cdh6.1的版本安装kylin2.6，你能成功启动了kylin吗
cdh6.1.0的环境安装kylin2.6.4
11号车厢: 大神，我在启动kylin的时候报了这种错，你知道怎么解决吗，我的环境是cdh6.1.1,Kylin 2.6.5的 Exception in thread "main" java.lang.IllegalArgumentException: Failed to find metadata store by url: kylin_metadata@hbase Caused by: java.lang.reflect.InvocationTargetException Caused by: java.lang.NoSuchMethodError: com.ctc.wstx.stax.WstxInputFactory.createSR(Lcom/ctc/wstx/api/ReaderConfig;Lcom/ctc/wstx/io/SystemId;Lcom/ctc/wstx/io/InputBootstrapper;ZZ)Lorg/apache/phoenix/shaded/org/codehaus/stax2/XMLStreamReader2;

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。