java代码读取dbsequence的值_spark — RDD数据源 读取小文件 数据写入MySQL并读取spark-HadoopAPISequenceFile 对象文件数据写入hbase并读取 )...

bc3f9276acf88283a0569b9b9ef9ee92.png

在线QQ客服:1922638

专业的SQL Server、MySQL数据库同步软件

f70ce410cf07396f1ba3766a2adc5a50.png

sc.textFile(” https://blog.csdn.net/weixin_44036154/article/details/dir/*.txt”)

如果传递了目录,则该目录中的所有文件都将读取为RDD。文件路径支持通配符。

但这对于读取大量小文件不是很有效,您应该使用WholeTextFiles

def WholeTextFiles(路径:String,minPartitions:Int = defaultMinPartitions):RDD [(String,String) ])

返回值RDD [(String,String)],其中键是文件名,值是文件的内容。

??

Spark支持通过Java JDBC访问关系数据库。需要使用JdbcRDD

数据输入到MySQL表代码演示

演示在MySQL数据库中读取表数据

Spark的整个生态系统与Hadoop完全兼容,因此Spark还支持Hadoop支持的文件类型或数据库类型。

HadoopRDD,newAPIHadoopRDD,saveAsHadoopFile,saveAsNewAPIHadoopFile是基础API

其他API接口都是为了最终Spark程序开发人员的方便而设置的,并且是这两个接口的有效实现版本。

38fcda47d4904b523de6e965adceba8e.png

f7a05bf5db1d5136f43d97f561914c1a.png

代码演示:

SequenceFile是Hadoop设计的平面文件,用于以二进制形式存储键值对。

b6388be9c5bd5825f146bbcc86ad324f.png

读取sc.sequenceFile [keyClass,valueClass](路径)

写入RDD.saveAsSequenceFile(路径)

要求将键和值自动转换为可写类型。

0c31f3d712978b39c00544b67db2957a.png

对象文件是序列化对象后保存的文件

读取sc.objectFile [k,v](路径)//由于已序列化,因此必须指定类型

写入RDD.saveAsObjectFile()

??

由于执行了? org.apache.hadoop.hbase.mapreduce.TableInputFormat类,Spark可以通过Hadoop输入格式访问HBase。

此输入格式将返回键值数据,

密钥类型是org。 apache.hadoop.hbase.io.ImmutableBytesWritable,

值类型为org.apache.hadoop.hbase.client.Result。

上面的代码:(创建hbase表,添加数据)

(读取hbase表数据)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值