Spark.sql Row

最新推荐文章于 2024-08-05 22:50:20 发布

qq_47506661

最新推荐文章于 2024-08-05 22:50:20 发布

阅读量500

点赞数

分类专栏： spark 大数据

本文链接：https://blog.csdn.net/qq_47506661/article/details/107191141

版权

博客介绍了在 Spark 中，使用 `Row` 进行数据处理的情况。针对 `example/word_count.py` 中 `rdd.map(lambda x: x[0])` 的疑惑，作者解释了这一步的目的是将 DataFrame 转换成 rdd，以便进行后续操作。作者计划探索是否可以直接在 DataFrame 上计算词频，而无需转换为 rdd。

摘要由CSDN通过智能技术生成

Row 使用

代码如下：

from pyspark.sql import SparkSession
from pysark.sql import Row

row =Row(name="andi",age=26)
>row[name]
>andi
>row

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_47506661

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark.sql Row

Row 使用代码如下：from pyspark.sql import SparkSessionfrom pysark.sql import Rowrow =Row(name="andi",age=26)>row[name]>andi>row[age]>29>row2=Row('i love rui')>row2[0]><Row('i love rui')>写以上代码的原因主要是example/word_count.py下
复制链接

扫一扫