spark保存到hbase java,java – 如何使用spark来处理一系列hbase行？

最新推荐文章于 2024-01-21 03:40:37 发布

IT小魔女

最新推荐文章于 2024-01-21 03:40:37 发布

阅读量168

点赞数

文章标签： spark保存到hbase java

以下是使用Spark中的扫描的示例：

import java.io.{DataOutputStream,ByteArrayOutputStream}

import java.lang.String

import org.apache.hadoop.hbase.client.Scan

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.hbase.io.ImmutableBytesWritable

import org.apache.hadoop.hbase.client.Result

import org.apache.hadoop.hbase.mapreduce.TableInputFormat

import org.apache.hadoop.hbase.util.Base64

def convertScanToString(scan: Scan): String = {

val out: ByteArrayOutputStream = new ByteArrayOutputStream

val dos: DataOutputStream = new DataOutputStream(out)

scan.write(dos)

Base64.encodeBytes(out.toByteArray)

}

val conf = HBaseConfiguration.create()

val scan = new Scan()

scan.setCaching(500)

scan.setCacheBlocks(false)

conf.set(TableInputFormat.INPUT_TABLE,"table_name")

conf.set(TableInputFormat.SCAN,convertScanToString(scan))

val rdd = sc.newAPIHadoopRDD(conf,classOf[TableInputFormat],classOf[ImmutableBytesWritable],classOf[Result])

rdd.count

您需要将相关的库添加到Spark类路径,并确保它们与您的Spark兼容.提示：您可以使用hbase classpath找到它们.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注