Spark-sql 计算某行值占累加总数的百分比

最新推荐文章于 2024-10-13 16:11:41 发布

小白鸽

最新推荐文章于 2024-10-13 16:11:41 发布

阅读量1w

点赞数 2

分类专栏： Spark 文章标签： spark-sql dataset 百分比

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baifanwudi/article/details/81589316

版权

先看原数据结构和数据样例

SparkSession spark=SparkSession.builder().master("local[*]").getOrCreate();

Dataset<Row> table=spark.read().json("src/main/data/transfer_line_count.json");

table.printSchema();
table.show();

root
 |-- from_city_name: string (nullable = true)
 |-- to_city_name: string (nullable = true)
 |-- total_num: long (nullable = true)

+--------------+------------+---------+
|from_city_name|to_city_name|total_num|
+--------------+------------+---------+
|           新乡市|         上海市|        2|
|           南昌市|         天津市|        3|
|           抚州市|         温州市|       36|
|           娄底市|         中山市|        1|
|           广州市|         孝感市|        3|
|           天门市|         岳阳市|        1|
|           长春市|         沈阳市|        6|
|           成都市|         眉山市|       10|
|           广州市|         怀集县|        2|
|           北海市|         广州市|        8|
</

最低0.47元/天解锁文章

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小白鸽 CSDN认证博客专家 CSDN认证企业博客

码龄12年

93: 原创

5万+: 周排名

4万+: 总排名

31万+: 访问

: 等级

3984: 积分

174: 粉丝

206: 获赞

173: 评论

435: 收藏

私信

关注

热门文章

分类专栏

数据仓库 8篇
数据科学 4篇
Flink 23篇
Spark 28篇
Hive 2篇
数据挖掘 4篇
Hbase 2篇
Python 7篇
SpringBoot 3篇
Java 8篇
ElasticSearch 5篇
爬虫 4篇
Linux 1篇

最新评论

【实时数仓架构】方法论
小白鸽: 卖课的不要到我这打广告。我这纯技术分享，讨论
Flink入门(十三) 读RocketMQ-Flink消息
xiao1092008605: 楼主您好，flink我运行起来控制台没输出，消费不到消息。消费者那边在不断产生消息，我本地启消费者方法是可以消费到的。
Flink入门(十三) 读RocketMQ-Flink消息
qq_22540509: 博主，我现在使用 rocketmq-flink,配置了之后出错org.apache.rocketmq.client.exception.MQClientException: The message queue is not in assigned list, message queue: MessageQueue [topic=test, brokerName=hecs-230484, queueId=0]，求救这个是什么问题。，，，
Flink数据统计UV、PV统计(三种写法)
小小只程序员: 用布隆过滤器的目的是为了减少资源开销，当然结果会存在误差，但是pv uv这个场景，有偏差也是能接受的吧，主要是能看到对应的趋势
Spark运行Xgboost且保存为PMML
昵称是什么~~~: 请问这个问题怎么解决的呢，万分感谢

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。