使用scala语言编写Spark独立应用程序统计文件行数

12 篇文章 1 订阅
11 篇文章 0 订阅

实现内容:
使用scala语言编写独立应用程序,读取HDFS系统文件“/user/hadoop/test.txt”,统计文件行数。
通过使用sbt工具将整个应用程序打包成jar包,并将jar包通过spark-submit提交到spark中运行。
代码:
SimpleApp.scala

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf

object SimpleApp{
  def main(args:Array[String]){
    val logFile = "/user/hadoop/test.txt"
    val conf = new SparkConf().setAppName("Simple Application")
    val sc = new SparkContext(conf)
    val logData = sc.textFile(logFile,2).cache()
    val num = logData.count()
    println("Long: %s".format(num))
  }
}

Simple.sbt
输入spark中显示的对应版本即可!

name :="Simple Project"
version := "1.0"
scalaVersion := "2.12.10"
libraryDependencies += "org.apache.spark" %% "spark-core" % "3.1.2"

打包并运行:
在这里插入图片描述
如果不加grep锁定,会显示很多其他不需要的信息。
我们可以看到标红的地方就是最后输出的结果。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是的,这段代码使用了EntityWrapper构建查询条件,查询数据库中符合条件的BanjiEntity实体对象。 具体来说,这里的queryWrapper是一个EntityWrapper对象,并使用eq方法设置了三个等于查询条件,分别是yuanxi_types等于banji对象的yuanxiTypes属性、banji_name等于banji对象的banjiName属性和banji_address等于banji对象的banjiAddress属性。这三个查询条件组合起来,构成了一个复合查询条件。 然后,这个queryWrapper对象会被传递给BanjiService的selectOne方法,用于查询符合条件的单条数据。查询结果会映射为BanjiEntity类型的对象,并返回给调用方。 例如: ``` Wrapper<BanjiEntity> queryWrapper = new EntityWrapper<BanjiEntity>() .eq("yuanxi_types", banji.getYuanxiTypes()) .eq("banji_name", banji.getBanjiName()) .eq("banji_address", banji.getBanjiAddress()); BanjiEntity banjiEntity = banjiService.selectOne(queryWrapper); ``` 在这个例子中,我们使用EntityWrapper构建了查询条件,然后将它传递给banjiService的selectOne方法,查询符合条件的单条数据。查询结果会映射为BanjiEntity类型的对象,并赋值给banjiEntity变量。 需要注意的是,如果查询结果为空,selectOne方法会返回null。如果查询结果不唯一,也就是符合条件的数据有多条,selectOne方法会抛出异常。 总之,这段代码使用了EntityWrapper构建查询条件,查询数据库中符合条件的BanjiEntity实体对象,并将查询结果映射为BanjiEntity类型的对象。需要注意查询结果为空或者不唯一的情况。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值