dataframe一列转化一个字符串_如何将Spark Dataframe列转换为字符串数组的单个列

我想知道如何将多个数据帧列“合并”为一个字符串数组?

例如,我有这个数据帧:

val df = sqlContext.createDataFrame(Seq((1, "Jack", "125", "Text"), (2,"Mary", "152", "Text2"))).toDF("Id", "Name", "Number", "Comment")

看起来像这样:

scala> df.show

+---+----+------+-------+

| Id|Name|Number|Comment|

+---+----+------+-------+

| 1|Jack| 125| Text|

| 2|Mary| 152| Text2|

+---+----+------+-------+

scala> df.printSchema

root

|-- Id: integer (nullable = false)

|-- Name: string (nullable = true)

|-- Number: string (nullable = true)

|-- Comment: string (nullable = true)

我怎样才能改变它,看起来像这样:

scala> df.show

+---+-----------------+

| Id| List|

+---+-----------------+

| 1| [Jack,125,Text]|

| 2| [Mary,152,Text2]|

+---+-----------------+

scala> df.printSchema

root

|-- Id: integer (nullable = false)

|-- List: Array (nullable = true)

| |-- element: string (containsNull = true)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值