Spark DataFrames

转自:http://www.k6k4.com/chapter/show/aafliljce1474164458328

1、样本数据

每一行存一个json对象

 
 
  1. { "name": "Andy", "age": 30 }
  2. { "name": "Justin", "age": 19 }
  3. { "name": "tom", "age": 21 }
文件路径为 example/input/data

2、加载数据


  
  
  1. scala> val df=spark.read.json("example/input/data")
  2. ...
  3. df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]

3、查看数据

 
 
  1. scala> df.show
  2. +---+------+
  3. |age| name|
  4. +---+------+
  5. | 30| Andy|
  6. | 19|Justin|
  7. | 21| tom|
  8. +---+------+

4、查看表Schema

 
 
  1. scala> df.printSchema
  2. root
  3. |-- age: long (nullable = true)
  4. |-- name: string (nullable = true)


5、数据查询基本操作

 
 
  1. scala> df.select("name").show
  2. +------+
  3. | name|
  4. +------+
  5. | Andy|
  6. |Justin|
  7. | tom|
  8. +------+
  9.  
  10. scala> df.select($"name",$"age"+1).show
  11. +------+---------+
  12. | name|(age + 1)|
  13. +------+---------+
  14. | Andy| 31|
  15. |Justin| 20|
  16. | tom| 22|
  17. +------+---------+
  18.  
  19. scala> df.filter($"age">21).show
  20. +---+----+
  21. |age|name|
  22. +---+----+
  23. | 30|Andy|
  24. +---+----+
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值