kudu的原理及java调用

灵豸

已于 2022-05-24 14:27:12 修改

阅读量498

点赞数

文章标签： hbase hadoop kudu

于 2022-05-24 14:23:27 首次发布

本文链接：https://blog.csdn.net/qq_28340701/article/details/124946008

版权

Kudu是为了解决HDFS不适合单条记录更新和HBase批处理性能不足的问题而设计的。它支持列式存储和随机读写，适合OLAP分析和实时写入更新。Kudu提供了Java API用于创建表、插入、更新、删除和查询数据，弥补了HDFS和HBase在特定场景下的不足。

摘要由CSDN通过智能技术生成

hdfs与hbase数据存储的缺点

目前数据存储有了HDFS与hbase，为什么还要额外的弄一个kudu呢?

HDFS:

使用列式存储格式Apache Parquet，Apache ORC，适合离线分析，不支持单条纪录级别的update操作，随机读写性能差。

HBASE:

可以进行高效随机读写，却并不适用于基于SQL的数据分析方向，大批量数据获取时的性能较差。

正因为HDFS与HBASE有上面这些缺点，KUDU较好的解决了HDFS与HBASE的这些缺点，它不及HDFS批处理快，也不及HBase随机读写能力强，但是反过来它比HBase批处理快（适用于OLAP（在线数据处理）的分析场景），而且比HDFS随机读写能力强（适用于实时写入或者更新的场景），这就是它能解决的问题。

KUDU的java操作

<dependency>
    <groupId>org.apache.kudu</groupId>
    <artifactId>kudu-client</artifactId>
    <version>${kudu.version}</version>
    <scope>test</scope>
</dependency>

<!--导入kudu的客户端工具-->
<dependency>
    <groupId>org.apache.kudu</groupId>
    <artifactId>kudu-client-tools</artifactId>
    <version>${kudu.version}</version>
</dependency>

表创建

 /**
     * 创建表
     * @throws Exception
     */
    public static void createTable() throws Exception{
        //1、创建一个client
        KuduClient client = new KuduClientBuilder(KUDU_MASTER).build();
        //2、创建schema信息
        List<ColumnSchema> columns = new ArrayList<ColumnSchema>();
        columns.add(new ColumnSchema.ColumnSchemaBuilder("id", Type.INT32).key(true).nullable(false).build());
        columns.add(new ColumnSchema.ColumnSchemaBuilder("name", Type.STRING).key(false).nullable(false).build());
        columns.add(new ColumnSchema.ColumnSchemaBuilder("age", Type.INT32).key(false).nullable(false).build());
        Schema schema = new Schema(columns);
        //3、指定分区字段
        List<String> partions = new ArrayList<String>();
        partions.add("id");
        //4、指定分区方式为hash分区、6个分区，一个副本
        CreateTableOptions options = new CreateTableOptions().addHashPartitions(partions, 6).setNumReplicas(1);
        //5、创建表，
        client.createTable("person",schema,options);

        client.close();
    }

Insert

/**
     * 插入数据
     * @throws Exception
     */
    public static void add() throws Exception{
        //1、创建一个client
        KuduClient client = new KuduClientBuilder(KUDU_MASTER).build();
        //2、打开表
        KuduTable table = client.openTable("person");
        //3、创建一个session会话
        KuduSession session = client.newSession();
        //4、创建插入
        Insert insert = table.newInsert();
        //5、指定插入数据
        insert.getRow().addInt("id",1);
        insert.getRow().addInt("age",18);
        insert.getRow().addString("name","张三");
        //6、应用插入
        session.apply(insert);

        session.close();

        client.close();

    }

update

/**
     * 更新数据
     * @throws Exception
     */
    public static void update() throws Exception{
        //1、创建kudu client
        KuduClient client = new KuduClientBuilder(KUDU_MASTER).build();
        //2、打开表
        KuduTable table = client.openTable("person");

        KuduSession session = client.newSession();

        Update update = table.newUpdate();
        update.getRow().addInt("id",1);
        update.getRow().addString("name","李四");

        session.apply(update);
        session.flush();
        session.close();

        client.close();
    }

delete

 /**
     * 删除数据
     * @throws Exception
     */
    public static void delete() throws Exception{
        //1、创建kudu client
        KuduClient client = new KuduClientBuilder(KUDU_MASTER).build();
        //2、打开表
        KuduTable table = client.openTable("person");

        KuduSession session = client.newSession();

        Delete delete = table.newDelete();
        delete.getRow().addInt("id",1);


        session.apply(delete);
        session.flush();
        session.close();

        client.close();
    }

query

 /**
     * 条件查询 select * from person where id=1
     * @throws Exception
     */
    public static void query() throws Exception{
        //1、创建kudu client
        KuduClient client = new KuduClientBuilder(KUDU_MASTER).build();
        //2、打开表
        KuduTable table = client.openTable("person");
        //3、创建scanner扫描器
        KuduScanner.KuduScannerBuilder kuduScannerBuilder = client.newScannerBuilder(table);
        //4、创建查询条件
        KuduPredicate filter = KuduPredicate.newComparisonPredicate(table.getSchema().getColumn("id"), KuduPredicate.ComparisonOp.EQUAL, 1);
        //5、将查询条件加入到scanner中
        KuduScanner scanner = kuduScannerBuilder.addPredicate(filter).build();
        //6、获取查询结果
        while (scanner.hasMoreRows()){
            RowResultIterator rows = scanner.nextRows();
            while (rows.hasNext()){
                RowResult row = rows.next();
                Integer id = row.getInt("id");
                String name = row.getString("name");
                int age = row.getInt("age");
                System.out.println(id+"---"+name+"---"+age);
            }
        }
        //7、关闭client
        client.close();
    }

灵豸

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
kudu的原理及java调用

hdfs与hbase数据存储的缺点目前数据存储有了HDFS与hbase，为什么还要额外的弄一个kudu呢?HDFS:使用列式存储格式Apache Parquet，Apache ORC，适合离线分析，不支持单条纪录级别的update操作，随机读写性能差。HBASE:可以进行高效随机读写，却并不适用于基于SQL的数据分析方向，大批量数据获取时的性能较差。正因为HDFS与HBASE有上面这些缺点，KUDU较好的解决了HDFS与HBASE的这些缺点，它不及HDFS批处理快，也不及HBas
复制链接

扫一扫