HBase专用过滤器

package com.shujia;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.IOException;

public class Demo04Filter {
    Connection conn;
    Admin admin;
    TableName stuName;
    Table stu;

    //传入一个过滤器 返回ResultScanner对象
    public ResultScanner getScanner(Filter filter) throws IOException {
        Scan scan = new Scan();

        scan.setFilter(filter);

        return stu.getScanner(scan);
    }

    //对ResultScanner对象进行打印
    //第一种情况:数据格式一致
    public void printScanner(ResultScanner rss) {
        //获取数据
        for (Result rs : rss) {
            String id = Bytes.toString(rs.getRow());
            String name = Bytes.toString(rs.getValue("info".getBytes(),"name".getBytes()));
            String age = Bytes.toString(rs.getValue("info".getBytes(),"age".getBytes()));
            String gender = Bytes.toString(rs.getValue("info".getBytes(),"gender".getBytes()));
            String clazz = Bytes.toString(rs.getValue("info".getBytes(),"clazz".getBytes()));

            System.out.println(id+","+name+","+age+","+gender+","+clazz);
        }
    }

    //第二种情况:数据格式不一致
    public void printScannerWithCellUnit(ResultScanner rss){
        for (Result rs : rss) {
            String rk = Bytes.toString(rs.getRow());
            for (Cell cell : rs.listCells()) {
                String cf = Bytes.toString(CellUtil.cloneFamily(cell));
                String qua=Bytes.toString(CellUtil.cloneQualifier(cell));
                String value=Bytes.toString(CellUtil.cloneValue(cell));
                System.out.println(rk+","+cf+","+qua+","+value);
            }
        }
    }

    @Before
    public void init() throws IOException {
        //创建HBase的配置
        Configuration conf = HBaseConfiguration.create();
        //配置HBase所属ZK集群的地址
        conf.set("hbase.zookeeper.quorum","master:2181,node1:2181,node2:2181");

        //建立连接
        conn = ConnectionFactory.createConnection(conf);
        //获取所有表的名字,这个操作跟表的数据无关
        admin= conn.getAdmin();
        stuName=TableName.valueOf("stu");
        stu=conn.getTable(stuName);
    }

    @Test
    //rowKey过滤器
    // 通过RowFilter过滤比rowKey 1500100010 小的所有值出来
    public void RowFilterWithBinaryComparator() throws IOException {

        //因为涉及到不等式的比较 所以只能使用二进制比较器
        BinaryComparator binaryComparator = new BinaryComparator("1500100010".getBytes());

        //小于,所以用CompareOp.LESS
        RowFilter rowFilter = new RowFilter(CompareFilter.CompareOp.LESS, binaryComparator);

        printScanner(getScanner(rowFilter));
    }

    @Test
    //列簇过滤器
    // 通过FamilyFilter与SubstringComparator查询列簇名包含nf的列簇下面所有的数据
    public void FamilyFilterWithSubstringComparator() throws IOException {

        SubstringComparator substringComparator = new SubstringComparator("f");

        FamilyFilter familyFilter = new FamilyFilter(CompareFilter.CompareOp.EQUAL, substringComparator);

        printScannerWithCellUnit(getScanner(familyFilter));
    }

    @Test
    //列名过滤器
    // 通过QualifierFilter与SubstringComparator查询列名包含n/l/d的列下面所有的数据
    public void QualifierFilterWithSubstringComparator() throws IOException {

        RegexStringComparator regexStringComparator = new RegexStringComparator(".*[mld].*");

        QualifierFilter qualifierFilter = new QualifierFilter(CompareFilter.CompareOp.EQUAL, regexStringComparator);

        printScannerWithCellUnit(getScanner(qualifierFilter));
    }

    @Test
    //列值过滤器
    // 通过ValueFilter与BinaryPrefixComparator过滤出所有的cell(所有的值)中值以 "张" 开头的学生
    //注意:并没有基于某一列去过滤 而是针对所有的cell的值进行过滤
    public void ValueFilterWithBinaryPrefixComparator() throws IOException {

        BinaryPrefixComparator binaryPrefixComparator = new BinaryPrefixComparator("张".getBytes());

        ValueFilter valueFilter = new ValueFilter(CompareFilter.CompareOp.EQUAL, binaryPrefixComparator);

        printScannerWithCellUnit(getScanner(valueFilter));

    }

    @Test
    //单列值过滤器
    //通过SingleColumnValueFilter与查询文科班所有学生信息
    //会返回完整的一行数据
    public void SingleColumnValueFilter() throws IOException {
        SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter("info".getBytes()
                , "clazz".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("文科".getBytes()));

        printScanner(getScanner(singleColumnValueFilter));
    }

    @Test
    //列值排除过滤器
    //通过 SingleColumnValueExcludeFilter与查询文科班所有学生信息
    //会返回完整的一行数据(除指定的比较列外)
    public void  SingleColumnValueExcludeFilter() throws IOException {
        SingleColumnValueExcludeFilter singleColumnValueExcludeFilter = new SingleColumnValueExcludeFilter("info".getBytes()
                , "clazz".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("文科".getBytes()));

        printScanner(getScanner(singleColumnValueExcludeFilter));
    }

    @After
    public void close() throws IOException {
        //关闭连接
        admin.close();
        conn.close();
    }
}
package com.shujia;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.IOException;
import java.nio.charset.StandardCharsets;

public class Demo04Filter {
    Connection conn;
    Admin admin;
    TableName stuName;
    Table stu;

    //传入一个过滤器 返回ResultScanner对象
    public ResultScanner getScanner(Filter filter) throws IOException {
        Scan scan = new Scan();

        scan.setFilter(filter);

        return stu.getScanner(scan);
    }

    //对ResultScanner对象进行打印
    //第一种情况:数据格式一致
    public void printScanner(ResultScanner rss) {
        //获取数据
        for (Result rs : rss) {
            String id = Bytes.toString(rs.getRow());
            String name = Bytes.toString(rs.getValue("info".getBytes(),"name".getBytes()));
            String age = Bytes.toString(rs.getValue("info".getBytes(),"age".getBytes()));
            String gender = Bytes.toString(rs.getValue("info".getBytes(),"gender".getBytes()));
            String clazz = Bytes.toString(rs.getValue("info".getBytes(),"clazz".getBytes()));

            System.out.println(id+","+name+","+age+","+gender+","+clazz);
        }
    }

    //第二种情况:数据格式不一致
    public void printScannerWithCellUnit(ResultScanner rss){
        for (Result rs : rss) {
            String rk = Bytes.toString(rs.getRow());
            for (Cell cell : rs.listCells()) {
                String cf = Bytes.toString(CellUtil.cloneFamily(cell));
                String qua=Bytes.toString(CellUtil.cloneQualifier(cell));
                String value=Bytes.toString(CellUtil.cloneValue(cell));
                System.out.println(rk+","+cf+","+qua+","+value);
            }
        }
    }

    @Before
    public void init() throws IOException {
        //创建HBase的配置
        Configuration conf = HBaseConfiguration.create();
        //配置HBase所属ZK集群的地址
        conf.set("hbase.zookeeper.quorum","master:2181,node1:2181,node2:2181");

        //建立连接
        conn = ConnectionFactory.createConnection(conf);
        //获取所有表的名字,这个操作跟表的数据无关
        admin= conn.getAdmin();
        stuName=TableName.valueOf("stu");
        stu=conn.getTable(stuName);
    }

    @Test
    //rowKey过滤器
    // 通过RowFilter过滤比rowKey 1500100010 小的所有值出来
    public void RowFilterWithBinaryComparator() throws IOException {

        //因为涉及到不等式的比较 所以只能使用二进制比较器
        BinaryComparator binaryComparator = new BinaryComparator("1500100010".getBytes());

        //小于,所以用CompareOp.LESS
        RowFilter rowFilter = new RowFilter(CompareFilter.CompareOp.LESS, binaryComparator);

        printScanner(getScanner(rowFilter));
    }

    @Test
    //列簇过滤器
    // 通过FamilyFilter与SubstringComparator查询列簇名包含nf的列簇下面所有的数据
    public void FamilyFilterWithSubstringComparator() throws IOException {

        SubstringComparator substringComparator = new SubstringComparator("f");

        FamilyFilter familyFilter = new FamilyFilter(CompareFilter.CompareOp.EQUAL, substringComparator);

        printScannerWithCellUnit(getScanner(familyFilter));
    }

    @Test
    //列名过滤器
    // 通过QualifierFilter与SubstringComparator查询列名包含n/l/d的列下面所有的数据
    public void QualifierFilterWithSubstringComparator() throws IOException {

        RegexStringComparator regexStringComparator = new RegexStringComparator(".*[mld].*");

        QualifierFilter qualifierFilter = new QualifierFilter(CompareFilter.CompareOp.EQUAL, regexStringComparator);

        printScannerWithCellUnit(getScanner(qualifierFilter));
    }

    @Test
    //列值过滤器
    // 通过ValueFilter与BinaryPrefixComparator过滤出所有的cell(所有的值)中值以 "张" 开头的学生
    //注意:并没有基于某一列去过滤 而是针对所有的cell的值进行过滤
    public void ValueFilterWithBinaryPrefixComparator() throws IOException {

        BinaryPrefixComparator binaryPrefixComparator = new BinaryPrefixComparator("张".getBytes());

        ValueFilter valueFilter = new ValueFilter(CompareFilter.CompareOp.EQUAL, binaryPrefixComparator);

        printScannerWithCellUnit(getScanner(valueFilter));

    }

    @Test
    //单列值过滤器
    //通过SingleColumnValueFilter与查询文科班所有学生信息
    //会返回完整的一行数据
    public void SingleColumnValueFilter() throws IOException {
        SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter("info".getBytes()
                , "clazz".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("文科".getBytes()));

        printScanner(getScanner(singleColumnValueFilter));
    }

    @Test
    //列值排除过滤器
    //通过 SingleColumnValueExcludeFilter与查询文科班所有学生信息
    //会返回完整的一行数据(除指定的比较列外)
    public void  SingleColumnValueExcludeFilter() throws IOException {
        SingleColumnValueExcludeFilter singleColumnValueExcludeFilter = new SingleColumnValueExcludeFilter("info".getBytes()
                , "clazz".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("文科".getBytes()));

        printScanner(getScanner(singleColumnValueExcludeFilter));
    }

    @Test
    //rowKey前缀过滤器
    //通过PrefixFilter查询以150010008开头的所有前缀的rowKey
    //PrefixFilter=RowFilter+BinaryPrefixComparator
    public void PrefixFilter() throws IOException {

        PrefixFilter prefixFilter = new PrefixFilter("150010008".getBytes());

        printScanner(getScanner(prefixFilter));
    }

    @Test
    //分页过滤器
    //pageSize 10
    //pageNum 3
    //做分页
    public void PageFilter() throws IOException {
        int pageNum=3;
        int pageSize=10;
        PageFilter pageFilter = new PageFilter((pageNum-1)*pageSize+1);

        Scan scan = new Scan();
        scan.setFilter(pageFilter);

        ResultScanner rss = stu.getScanner(scan);
        String rk="";
        for (Result rs : rss) {
            rk=Bytes.toString(rs.getRow());
        }
        Scan scan1 = new Scan();
        scan1.withStartRow(rk.getBytes());
//        PageFilter pageFilter1 = new PageFilter(pageSize);
//        scan1.setFilter(pageFilter1);
        scan1.setLimit(pageSize);
       printScanner(stu.getScanner(scan1));
    }

    @Test
    /**
     * PageFilter效率太低,需要遍历
     * 所以分页一般需要结合RowKey的设计去实现
     */
    public void pageWithRk() throws IOException {
        int rk_base=1500100000;
        int pageNum=7;
        int pageSize=10;

        String startRow=rk_base+(pageNum-1)*pageSize+1+"";
        String endRow=rk_base+pageNum*pageSize+1+"";

        Scan scan = new Scan();
        scan.withStartRow(startRow.getBytes());
        scan.withStopRow(endRow.getBytes());

        printScanner(stu.getScanner(scan));
    }

    @Test
    //多条件查询
    //过滤出 文科一班 的 男生的信息 并且 id 包含 8
    public void FilterList() throws IOException {
        SingleColumnValueFilter filter1= new SingleColumnValueFilter("info".getBytes()
                , "clazz".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("文科一班".getBytes()));

        SingleColumnValueFilter filter2 = new SingleColumnValueFilter("info".getBytes()
                , "gender".getBytes()
                , CompareFilter.CompareOp.EQUAL
                , new BinaryPrefixComparator("男".getBytes()));

        RowFilter rowFilter = new RowFilter(CompareFilter.CompareOp.EQUAL, new SubstringComparator("8"));

        /**
         * Operator.MUST_PASS_ALL 相当于 and 默认
         * Operator.MUST_PASS_ONE 相当于 or
         */
        FilterList filterList = new FilterList(FilterList.Operator.MUST_PASS_ALL);
        filterList.addFilter(filter1);
        filterList.addFilter(filter2);
        filterList.addFilter(rowFilter);

       printScanner(getScanner(filterList));
    }

    @After
    public void close() throws IOException {
        //关闭连接
        admin.close();
        conn.close();
    }
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【优质项目推荐】 1、项目代码均经过严格本地测试,运行OK,确保功能稳定后才上传平台。可放心下载并立即投入使用,若遇到任何使用问题,随时欢迎私信反馈与沟通,博主会第一时间回复。 2、项目适用于计算机相关专业(如计科、信息安全、数据科学、人工智能、通信、物联网、自动化、电子信息等)的在校学生、专业教师,或企业员工,小白入门等都适用。 3、该项目不仅具有很高的学习借鉴价值,对于初学者来说,也是入门进阶的绝佳选择;当然也可以直接用于 毕设、课设、期末大作业或项目初期立项演示等。 3、开放创新:如果您有一定基础,且热爱探索钻研,可以在此代码基础上二次开发,进行修改、扩展,创造出属于自己的独特应用。 欢迎下载使用优质资源!欢迎借鉴使用,并欢迎学习交流,共同探索编程的无穷魅力! 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值