基于Bboss快速构建高效、可靠、安全的Elasticserach全文检索以及统计分析应用

本文介绍了Bboss后端技术,包括其基于Gradle的模块化构建、丰富的功能模块如数据同步ETL、J2ee开发框架、微服务支持等,强调了其安全性、SpringBoot集成以及数据采集和流批一体化计算能力。文章还提到了网络安全相关的内容和学习路径。
摘要由CSDN通过智能技术生成

一、简介

Bboss后端基于Gradle模块化构建,灵活便捷。框架模块丰富,涵盖数据同步ETL工具、J2ee开发框架、微服务、数据库、中间件、安全、配置、缓存、国际化、elasticsearch
client、web
session共享、redis、kafka、mongodb工具包等常用模块,最大程度满足开发需要。同时,严格遵守WEB安全规范,从根本上避免SQL注入、XSS攻击、CSRF攻击等常见的
Web 攻击手段。支持主流的分布式微服务架构,快速构建高可用服务集群。

Bboss基于Apache License开源协议,由开源社区bboss发起和维护,主要由以下三部分构成:

  • Elasticsearch Highlevel Java Restclient , 一个高性能高兼容性的Elasticsearch/Opensearch java客户端框架

  • 数据采集同步ETL ,一个基于java语言实现数据采集作业的强大ETL工具,提供丰富的输入插件和输出插件,可以基于插件规范轻松扩展新的输入插件和输出插件

  • 流批一体化计算框架 ,提供灵活的数据指标统计计算流批一体化处理功能的简易框架,可以结合数据采集同步ETL工具,实现数据流处理和批处理计算,亦可以独立使用;计算结果可以保存到各种关系数据库、分布式数据仓库Elasticsearch、Clickhouse等,特别适用于数据体量和规模不大的企业级数据分析计算场景,具有成本低、见效快、易运维等特点,助力企业降本增效。

此外,B-BOSS还是中国移动面向商业客户的后台业务支撑系统,功能上不仅涵盖了集团客户和合作伙伴的计费(部分)、结算、账务、业务等方面,并且尝试建立对于全电信业务的综合服务开通,服务保障机制。

二、功能特色

  1. ORM和DSL二者兼顾,类mybatis方式操作ElasticSearch,提供丰富的开发API和开发Demo;

  2. 采用XML文件配置和管理检索dsl脚本,简洁而直观;提供丰富的逻辑判断语法,在dsl脚本中可以使用变量、脚本片段、foreach循环、逻辑判断、注释;基于可扩展DSL配置管理机制可以非常方便地实现数据库、redis等方式管理dsl;配置管理的dsl语句支持在线修改、自动热加载,开发和调试非常方便;

  3. 提供Elasticsearch集群节点自动负载均衡和容灾恢复机制,Elasticsearch节点断连恢复后可自动重连,高效可靠;

  4. 提供Elasticsearch集群节点自动发现机制:自动发现Elasticsearch服务端节点增加和下线操作并变更客户端集群可用节点地址清单;

  5. 提供http 连接池管理功能,提供精细化的http连接池参数配置管理;

  6. 支持在应用中访问和操作多个Elasticsearch集群,每个Elasticsearch集群的版本可以不同;

  7. 支持基于X-Pack和searchguard两种安全认证机制;

  8. 支持Elasticsearch-SQL-ORM和Elasticsearch-JDBC;

  9. 提供高效的BulkProcessor处理机制;

  10. 提供按时间日期ES历史数据清理工具;

学习成本低,上手快,代码简洁,安全高效,客户端负载容灾,兼容性好,易于集成。

三、应用场景

![图片](https://img-
blog.csdnimg.cn/img_convert/8839cc80f9ff2373c9e40e00b4856749.png)

四、Elasticsearch Highlevel Java Restclient

Bboss Elasticsearch Highlevel Java Restclient是一套基于query
dsl语法操作和访问分布式搜索引擎Elasticsearch/Opensearch的o/r mapping高性能开发库

![图片](https://img-
blog.csdnimg.cn/img_convert/5a5cddc95f4e29e4966cd0d9b94f6edb.png)

五、数据采集同步ETL以及流批一体化计算框架

数据采集同步ETL以及流批一体化计算框架,基于灵活的插件体系结构,提供数据采集、数据清洗转换处理和数据入库以及数据指标统计计算流批一体化处理功能,提供丰富的输入插件和输出插件,可以基于插件规范轻松扩展新的输入插件和输出插件:

![图片](https://img-
blog.csdnimg.cn/img_convert/aa580597ae4225c3399f76ee2667465a.png)

六、数据采集ETL

数据采集同步ETL以及流批一体化计算作业分为作业配置态和运行态,作业可以独立调度运行,亦可以嵌入到应用中运行,同时也可以和各种主流的调度引擎(quartz、xxl-
job等)结合运行:

![图片](https://img-
blog.csdnimg.cn/img_convert/a3b7b5b0ecff97b93ba7fdebeb84ea93.png)

通过bboss可以灵活定制具备各种功能的数据采集统计作业:

  1. 只采集和处理数据作业;

  2. 采集和处理数据、指标统计计算混合作业–通过ImportBuilder注册ETLMetrics+其他数据源Output插件结合实现;

    importBuilder.setDataTimeField(“logOpertime”);
    importBuilder.addMetrics(keyMetrics);//通过importBuilder注册指标计算器,对采集数据进行指标计算并保存指标计算结果到各种数据库
    ElasticsearchOutputConfig elasticsearchOutputConfig = new ElasticsearchOutputConfig();
    elasticsearchOutputConfig
    .setTargetElasticsearch(“default”)
    .setIndex(“dbdemo”)
    .setEsIdField(“log_id”)//设置文档主键,不设置,则自动产生文档id
    .setDebugResponse(false)//设置是否将每次处理的reponse打印到日志文件中,默认false
    .setDiscardBulkResponse(false);//设置是否需要批量处理的响应报文,不需要设置为false,true为需要,默认false
    importBuilder.setOutputConfig(elasticsearchOutputConfig);//设置Elasticsearch输出插件,保存加工后的原始数据

  3. 采集数据只做指标统计计算作业–通过指标插件MetricsOutputConfig实现;

    MetricsOutputConfig metricsOutputConfig = new MetricsOutputConfig();
    metricsOutputConfig.setDataTimeField(“logOpertime”);
    metricsOutputConfig.addMetrics(keyMetrics);//通过Metrics输出插件注册指标计算器,对采集数据进行指标计算并保存指标计算结果到各种数据库
    importBuilder.setOutputConfig(metricsOutputConfig);//设置Metrics输出插件

4)可以在应用中单独集成和使用指标统计功能;

七、数据采集特点

Bboss支持全量和增量数据采集,增量数据采集默认基于sqlite数据库管理增量采集状态,可以配置到其他关系数据库管理增量采集状态,提供对多种不同数据来源增量采集机制:

  1. 基于数字字段增量采集:各种关系数据库、Elasticsearch、MongoDB、Clickhouse等;

  2. 基于时间字段增量采集:各种关系数据库、Elasticsearch、MongoDB、Clickhouse、HBase等,基于时间增量还可以设置一个截止时间偏移量,比如采集到当前时间前十秒的增量数据,避免漏数据;

  3. 基于文件内容位置偏移量:文本文件、日志文件基于采集位置偏移量做增量;

  4. 基于ftp文件增量采集:基于文件级别,下载采集完的文件就不会再采集;

  5. 支持mysql binlog,实现mysql增删改实时增量数据采集;

八、流批一体化计算特点

  1. 支持时间维度和非时间维度指标计算;

  2. 时间维度指标计算:支持指定统计滑动时间窗口,支持设定时间统计窗口类型,在流处理或者离线处理过程中,对于数据到来的先后顺序没有严格要求,乱序数据不影响最终指标计算结果;

  3. 一个指标支持多个维度和多个度量字段计算,多个维度字段值构造成指标的唯一指标key,支持有限基数key和无限基数key指标计算(维度字段组合形成的唯一指标key的个数是有限的就是有限基数,个数是无限的就是无限基数);

  4. 一个作业可以支持多种类型的指标,每种类型指标支持多个指标计算;

  5. 支持准实时指标统计计算和离线指标统计计算;

  6. 可以从不同的数据输入来源获取需要统计的指标数据,亦可以将指标计算结果保存到各种不同的目标数据源;

九、典型应用案例—互联网用户行为分析监控

![图片](https://img-
blog.csdnimg.cn/img_convert/c3588450782295e4498afa29e9c4e321.png)

十、兼容性

作为Elasticsearch兼容性最好的java客户端和数据采集&流批一体化计算工具,bboss各版本对Elasticsearch、Spring
boot兼容性说明如下:

bbossElasticsearchspring boot
all1.x1.x,2.x,3.x
all2.x1.x,2.x,3.x
all5.x1.x,2.x,3.x
all6.x1.x,2.x,3.x
all7.x1.x,2.x,3.x
all8.x1.x,2.x,3.x

jdk兼容性:jdk 1.8+

十一、 Spring Boot 集成 Bboss

要在Spring Boot中集成BBoss并实现Elasticsearch的增删查改,需要按照以下步骤操作:

1. 添加依赖

在你的pom.xml文件中添加BBoss和Elasticsearch的依赖:

<dependencies>
    <!-- BBoss -->
    <dependency>
        <groupId>com.github.bboss</groupId>
        <artifactId>bboss-framework</artifactId>
        <version>最新版本</version>
    </dependency>
    <!-- Elasticsearch -->
    <dependency>
        <groupId>org.elasticsearch</groupId>
        <artifactId>elasticsearch</artifactId>
        <version>最新版本</version>
    </dependency>
</dependencies>

2.配置Elasticsearch

在application.properties文件中配置Elasticsearch的相关信息:

spring.data.elasticsearch.cluster-name=你的集群名称
spring.data.elasticsearch.cluster-nodes=你的节点地址

3. 创建实体类

创建一个实体类,用于映射Elasticsearch中的文档。例如,创建一个名为User的实体类:

import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;

@Document(indexName = "user", type = "_doc")
public class User {
    @Id
    private String id;
    private String name;
    private int age;

    // getter和setter方法
}

4. 创建Repository接口

创建一个继承自ElasticsearchRepository的接口,用于操作Elasticsearch:

import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;

public interface UserRepository extends ElasticsearchRepository<User, String> {

}

5. 使用Repository进行增删查改操作

在你的服务类中,注入UserRepository并使用它进行增删查改操作:

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;

@Service
public class UserService {
    @Autowired
    private UserRepository userRepository;

    // 增加用户
    public User save(User user) {
        return userRepository.save(user);
    }

    // 删除用户
    public void delete(String id) {
        userRepository.deleteById(id);
    }

    // 更新用户
    public User update(User user) {
        return userRepository.save(user);
    }

    // 查询用户
    public User findById(String id) {
        return userRepository.findById(id).orElse(null);
    }
}

现在你可以在你的应用中使用UserService来进行Elasticsearch的增删查改操作了。

![图片](https://img-
blog.csdnimg.cn/img_convert/dd09d6276298041af5d7351e37bdd704.png)

接下来我将给各位同学划分一张学习计划表!

学习计划

那么问题又来了,作为萌新小白,我应该先学什么,再学什么?
既然你都问的这么直白了,我就告诉你,零基础应该从什么开始学起:

阶段一:初级网络安全工程师

接下来我将给大家安排一个为期1个月的网络安全初级计划,当你学完后,你基本可以从事一份网络安全相关的工作,比如渗透测试、Web渗透、安全服务、安全分析等岗位;其中,如果你等保模块学的好,还可以从事等保工程师。

综合薪资区间6k~15k

1、网络安全理论知识(2天)
①了解行业相关背景,前景,确定发展方向。
②学习网络安全相关法律法规。
③网络安全运营的概念。
④等保简介、等保规定、流程和规范。(非常重要)

2、渗透测试基础(1周)
①渗透测试的流程、分类、标准
②信息收集技术:主动/被动信息搜集、Nmap工具、Google Hacking
③漏洞扫描、漏洞利用、原理,利用方法、工具(MSF)、绕过IDS和反病毒侦察
④主机攻防演练:MS17-010、MS08-067、MS10-046、MS12-20等

3、操作系统基础(1周)
①Windows系统常见功能和命令
②Kali Linux系统常见功能和命令
③操作系统安全(系统入侵排查/系统加固基础)

4、计算机网络基础(1周)
①计算机网络基础、协议和架构
②网络通信原理、OSI模型、数据转发流程
③常见协议解析(HTTP、TCP/IP、ARP等)
④网络攻击技术与网络安全防御技术
⑤Web漏洞原理与防御:主动/被动攻击、DDOS攻击、CVE漏洞复现

5、数据库基础操作(2天)
①数据库基础
②SQL语言基础
③数据库安全加固

6、Web渗透(1周)
①HTML、CSS和JavaScript简介
②OWASP Top10
③Web漏洞扫描工具
④Web渗透工具:Nmap、BurpSuite、SQLMap、其他(菜刀、漏扫等)

那么,到此为止,已经耗时1个月左右。你已经成功成为了一名“脚本小子”。那么你还想接着往下探索吗?

阶段二:中级or高级网络安全工程师(看自己能力)

综合薪资区间15k~30k

7、脚本编程学习(4周)
在网络安全领域。是否具备编程能力是“脚本小子”和真正网络安全工程师的本质区别。在实际的渗透测试过程中,面对复杂多变的网络环境,当常用工具不能满足实际需求的时候,往往需要对现有工具进行扩展,或者编写符合我们要求的工具、自动化脚本,这个时候就需要具备一定的编程能力。在分秒必争的CTF竞赛中,想要高效地使用自制的脚本工具来实现各种目的,更是需要拥有编程能力。

零基础入门的同学,我建议选择脚本语言Python/PHP/Go/Java中的一种,对常用库进行编程学习
搭建开发环境和选择IDE,PHP环境推荐Wamp和XAMPP,IDE强烈推荐Sublime;

Python编程学习,学习内容包含:语法、正则、文件、 网络、多线程等常用库,推荐《Python核心编程》,没必要看完

用Python编写漏洞的exp,然后写一个简单的网络爬虫

PHP基本语法学习并书写一个简单的博客系统

熟悉MVC架构,并试着学习一个PHP框架或者Python框架 (可选)

了解Bootstrap的布局或者CSS。

阶段三:顶级网络安全工程师

如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!

学习资料分享

当然,只给予计划不给予学习资料的行为无异于耍流氓,这里给大家整理了一份【282G】的网络安全工程师从入门到精通的学习资料包,可点击下方二维码链接领取哦。

  • 12
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值