spark之基础学习篇：load文件 — WordCount

最新推荐文章于 2023-03-16 15:17:41 发布

smarthhl

最新推荐文章于 2023-03-16 15:17:41 发布

阅读量2.1k

点赞数

分类专栏： spark

spark 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

摘自: http://bbs.easysoo.cn/?p=463

本节主要讲解spark加载不同的文件格式的方法，并且从local模式和cluster模式进行说明。

1、加载txt文件

/**
 * txt格式：以空格分割
 */
import org.apache.spark.{SparkContext, SparkConf}
object WordCount {
  def main(args: Array[String]) {
 
    val conf = new SparkConf().setAppName("txtwd")
 
	val path = "file:///usr/local/spark/sbin/p.txt"    //local模式
    //val path = "hdfs://usr/spark/p.txt"    //集群模式
    val sc = new SparkContext(conf)
    sc.textFile(path).flatMap(_.split(" ")).map(x =&gt; (x, 1))
           .reduceByKey(_ + _).take(10).foreach(println)
    sc.stop()
  }
}

2、加载json文件

/**
 * json格式：{"name":"xxx","age":12}
 */
import org.apache.spark.SparkContext
object TestSql {
  def main(args: Array[String]) {
 
    val sc = new SparkContext()
    val sqlContext = new org.apache.spark.sql.SQLContext(sc)
 
    val path = "file:///usr/local/spark/sbin/p.json"//local模式
    //val path = "hdfs://usr/spark/p.json" //集群模式
 
    val people = sqlContext.jsonFile(path)
 
    people printSchema()
    people.registerTempTable("people")
 
    sqlContext.sql("select name,age from people where age &gt; 10").collect.foreach(println)
  }
}

3、加载parquet文件

>>>>未完，请浏览下节

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

smarthhl CSDN认证博客专家 CSDN认证企业博客

码龄16年

39: 原创

30万+: 周排名

91万+: 总排名

11万+: 访问

: 等级

1456: 积分

99: 粉丝

26: 获赞

11: 评论

135: 收藏

私信

关注

热门文章

分类专栏

最新评论

Eclipse 和 MyEclipse控制台console不停的自动跳动，跳出来解决方案
心静自然梁呢: 可以啊，兄弟，这玩意搞了我一周了，看变量都看不了。弄好了，感谢
数据分析师常见的十道面试题目
金喲: 改下标题，数据分析师有好多种，这都是啥面试题
数据分析师常见的十道面试题目
qq_21554207: 我看着也不像哈哈哈，可能还是我刚学到皮毛吧
数据分析师常见的十道面试题目
MISS ZHENG: 这个是数据分析岗？可怕，咋一看都考的算法题
R语言连接HIVE
yaoqsm: Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1], : java.lang.NoClassDefFoundError: Could not initialize class org.apache.hive.jdbc.HiveConnection 你好，我碰见了这个错误，请问怎么解决呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。