分布式服务架构-第四章大数据日志系统的构建

最新推荐文章于 2022-08-31 11:58:39 发布

zhendeWD

最新推荐文章于 2022-08-31 11:58:39 发布

阅读量1.9k

点赞数

分类专栏： # 分布式服务架构原理设计与实践分布式文章标签：架构 big data 大数据

本文链接：https://blog.csdn.net/weixin_39795049/article/details/122916976

版权

分布式同时被 2 个专栏收录

17 篇文章 2 订阅

订阅专栏

分布式服务架构原理设计与实践

6 篇文章 0 订阅

订阅专栏

1.开源日志框架的原理分析与应用实践

1.1 JDK Logger

不需要集成任何类库，只要有jvm运行环境，直接使用。

级别：all、finest、finer、fine、config、info、warning、servere、off

public static Logger logger = Logger.getLogger(JDKLoggerDemo.class.toString());

1.2 Apache Commons Logging

JCL提供了操作日志的接口，而具体的日志实现交给Log4j这样的开源日志框架完成。

1.2.1.实现结构

Commons Logging：org.apache.commons.logging 和org.apache.commons.logging.impl

实现类具体职责

Log：日志对象接口，封装了操作日志的方法，级别trace<debug<info<warn<error
LogFactory：获取日志对象工厂类
LogFactoryImpl：真正获取日志对象
Log4JLogger：对Log4j的日志对象的封装
Jdk14Logger：对JDK1.4Logger的日志对象封装
SimpleLog：自带的简单的日志记录器

1.2.2使用方式

Commons Logging

①maven配置依赖

<dependency>
	<groupId>Commonss-logging</groupId>
	<artifactId>Commobss-logging</artifactId>
	<version>1.1.3</version>
</dependency>

②测试代码

private Log log = LogFactory.getLog(CommonsLoggingDemo.class);

③配置文件

#指定日志对象
org.apache.commons.logging.Log = org.apache.commons.logging.impl.Jdk14Logger
#指定日志工厂
org.apache.commons.logging.LogFactory = org.apache.commons.logging.impl.LogFactoryImpl

1.2.3类加载方式

顺序：

寻找JVM内的org.apache.commons.logging.LogFactory属性配置，如果找到，使用配置的日志工厂
使用jdk从1.3版本开始提供服务的发现机制，扫描类路径下的META-INF/services/org.apache.commons.logging.LogFactory文件，如果找到，装载配置，使用其中配置加载日志工厂
从类路径中查找配置文件commons-logging。properties，如果找到，则根据其中配置加载具体日志实现框架
如果前面的配置文件不存在使用默认配置，通过反射api判断log4j是否存在于类路径中，不存在，判断jdk14Logger是否存在于类路径中，如果都不存在，则使用内部简单的SimpleLog来实现。

通过配置动态地找到具体的实现类，如果实现类不在类路径中或者被限制使用，则无法加载。

1.3 Apache Log4j（简称Log4j）

1.3.1实现结构

org.apache.log4 包含Log4j主要的实现类：Logger、Layout、Appender和LogManager

Logger ：日志对象，负责捕捉日志记录信息
- Level类定义级别：all<debug<info<warn<error<fatal<off
Appender:日志输出目的地，负责把格式化的日志信息输出到指定的地方
- ConsoleAppender：把日志输出到控制台中
- FileAppender：把日志输出到磁盘文件
- DailyRollingFileAppender：每天产生一个日志磁盘文件，日志文件按天滚动生成
- RollingFileAppender：日志磁盘文件的大小达到指定尺寸时会产生一个新的文件，日志文件按照日志大小滚动生成
Layout：对日志进行格式化，负责生成不同格式的日志信息
- HTMLLayout：以HTML表格形式布局展示
- PatternLayout：自定义指定的格式展示
- SimpleLayout：只包含日志信息的级别和信息字符串
- TTCCLayout：包含日志产生的时间，线程，类别等信息

1.3.2使用方式

①maven配置依赖

<dependency>
    <groupId>log4j</groupId>
    <artifactId>log4j</artifactId>
    <version>1.2.17</version>          
</dependency>

②测试代码

Logger log = Logger.getLogger(Log4jDemo.class);

③配置文件

# 声明 log4j.prgperties
log4j.rootLogger = INFO,FILE,CONSOLE
log4j.appender.FILE=org.apache.log4j.FileAppender
log4j.appender.FILE.File = /home/robert/Log4jDemo.log
log4j.appender.FILE.ImmediateFlush=true
log4j.appender.FILE.Threshold=DEBUG
log4j.appender.FILE.Append=true
log4j.appender.FILE.layout=org.apache.log4j.PatternLayout
log4j.appender.FILE.layout.conversionPattern=%d(ABSOLUTE) %5P %C(1):%L - %m%n

log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender
log4j.appender.CONSOLE.Target=System.out
log4j.appender.CONSOLE.ImmediateFlush=true
log4j.appender.CONSOLE.Threshold=DEBUG
log4j.appender.CONSOLE.layout=org.apache.log4j.PatternLayout
log4j.appender.CONSOLE.encoding=UTF-8
log4j.appender.CONSOLE.layout.conversionPattern=%d(ABSOLUTE) %5p %c(1):%L - %m%n

# 声明log4j.xml
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE log4j:configuration SYSTEM "log4j.dtd">
<log4j:configuration>
	<appender name="CONSOLE" class="org.apache.log4j.ConsoleAppender">
		<param name="target" value="System.out"/>
		<param name="immediateFlush" value="true"/>
		<param name="threshold" value="DEBUG"/>
		<param name="append" value="true"/>
		<layout class="org.apache.log4j.PatternLayout">
			<param name="ConversionPattern" value="%d - %c -% - 4r [%t] %-5p $x -%m%n" />
		</layout>
	</appender>
	...
<root>
	<priority value="info"/>
	<appender-ref ref="CONSOLE"/>
	<appender-ref ref="FILE"/>
</root>
</log4j:configuration>

1.3.3Log4j 的锁和性能优化

Log4j默认的Appenders使用同步锁来实现

eg：Netty作为HTTP服务器实现的一个类似回显的服务，使用Log4j记录业务日志，压测时发现每秒最多可处理9000个请求，关闭日志时发现每秒最多可处理28000个请求。

为找性能瓶颈，在预测过程中，使用Jstack命令发现并发时线程都在等待一个写日志事件的锁。

多个线程同时使用一个Logger时，在Category层次上加了同步锁

锁一个在Category层次，一个在Appender层次，在高并发的情况下对系统的性能影响很大一个时段只能有一个线程在打印日志会阻塞其他大部分业务线程，而对日志收集不是核心链路上的功能，应作为一个辅助操作，不能影响核心业务功能。

。。。

1.4 Slf4j

可以只依赖于Slf4j来实现日志打印，具体日志实现由配置来决定使用Log4j还是Logback等。

1.4.1实现结构

门面模式，在编译时确定底层日志实现框架，只要底层的日志实现Jar包和Slf4j的静态编译转接包在类路径下即可。

Slf4j对于每种日志实现框架都提供了一个转接的jar包，jar包里面包含LoggerFactoryBinder接口的实现。

Slf4j实现的静态编译绑定架构，应用层程序会用Slf4j api打印日志，api使用不同的日志实现转接Jar包里面的StaticLoggerBinder类到不同的日志实现框架中。

增加了参数化日志，打印复杂日志内容时不再需要判断相应的级别是否已经打开

1.4.2使用方式

①pom.xml中单独引入底层日志实现的转接Jar包

<!--slf4j-->
<dependency>
	<groupId>org.slf4j</groupId>
    <artifactId>slf4j-api</artifactId>
    <version>1.7.20</version>
</dependency>
<!--slf4j-log4j-->
<dependency>
	<groupId>org.slf4j</groupId>
    <artifactId>slf4j-log4j12</artifactId>
    <version>1.7.12</version>
</dependency>
<!--log4j-->
<dependency>
	<groupId>log4j</groupId>
    <artifactId>log4j</artifactId>
    <version>1.2.17</version>
</dependency>

②代码

Logger logger = LoggerFactory.getLogger(Slf4jLog4jDemo.class);

③配置文件

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE log4j:configuration SYSTEM "log4j.dtd">
<log4j:configuration>
	<appender name="CONSOLE" class="org.apache.log4j.ConsoleAppender">
    	<param name="Target" value="System.out"/>
        <param name="ImmediateFlush" value="true"/>
        <param name="encoding" value="UTF-8"/>
        <layout class="org.apache.log4j.PatternLayout">
        	<param name="ConversionPattern" value="%d %t %-5p(%c:%L)-%m%n"/>
        </layout>
    </appender>
    <root>
    	<priority value="debug"/>
        <appender-ref ref="CONSOLE"/>
    </root>
</log4j:configuration>

Slf4j只提供了一个核心模块slf4j-api.jar，这个模块下只有日志接口，没有具体的实现，需要单独添加底层日志实现的转接包和实现Jar包。但是这个底层日志类实际和Slf4j并没有任何关系，Slf4j通过增加日志的中间转接层来转换相应的实现。

1.5 Logback

1.5.1实现结构

Logback三个模块：logback-core、logback-classic 和 logback-access

logback-core：后面两个模块的基础模块，包含日志框架实现的所有基础类
logback-classic：完整地实现了Slf4j API
logback-access 与 Servlet 容器集成，提供了丰富的HTTP访问日志功能

1.5.2使用方式

①依赖

<!--slf4j-->
<dependency>
	<groupId>org.slf4j</groupId>
    <artifactId>slf4j-api</artifactId>
    <version>1.7.20</version>
</dependency>
<!--logback-->
<dependency>
	<groupId>ch.qos.logback</groupId>
    <artifactId>logback-classic</artifactId>
    <version>1.1.7</version>
</dependency>
<dependency>
	<groupId>ch.qos.logback</groupId>
    <artifactId>logback-core</artifactId>
    <version>1.1.7</version>
</dependency>
<dependency>
	<groupId>ch.qos.logback</groupId>
    <artifactId>logback-access</artifactId>
    <version>1.1.7</version>
</dependency>

②代码

Logger logger = LoggerFactory.getLogger(Slf4jLogbackDemo.class);

③配置文件

<!--每天生成一个文件，归档文件保存30天：-->
<configuration>
	<!--设置自定义pattern属性-->
    <property name="pattern" value="%d{HH:MM:ss.SSS}[%-5level][%thread][%logger]%msg%n"/>
    <!--控制台输出日志-->
    <appender name="CONSOLE" class="ch.qos.logback.core.ConsoleAppender">
    <!--设置控制台输出日志的格式-->
        <encoder>
        	<pattern>${pattern}</pattern>
        </encoder>
    </appender>
    <!--滚动记录日志文件-->
    <appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
        <!--当天生成的日志文件名称-->
        <file>/home/robert/log/log.out</file>
        <!--根据时间记录日志文件-->
        <rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
        <!--归档日志文件名称-->
            <fileNamePattern>testLog-%d{yyyy-MM-dd}.log</fileNamePattern>
            <!--归档文件保存30天-->
            <maxHistory>30</maxHistory>
        </rollingPolicy>
        <!--生成日志信息格式-->
        <encoder>
            <pattern>${pattern}</pattern>
        </encoder>
    </appender>
    <!--根root logger-->
    <root level="DEBUG">
    	<!--设置根logger的日志输出目的地-->
        <appender-ref ref="FILE"/>
        <appender-ref ref="CONSOLE"/>
    </root>
</configuration>

1.5.3性能提升

Logback对Log4j的内核进行了重写和优化，在一些关键执行路径上性能提升了至少10倍，初始化内存加载也变得更小了。

1. 6 Apache Log4j 2（Log4j 2，Log4j升级版本）

通过log4j-to-slf4j兼容模式，使用Log4j 2 api的应用完全可以转接到Slf4j支持的任何日志框架上。

可以动态地加载修改过的配置，在动态加载的过程中不会丢失日志

1.6.1实现结构

Log4j 2 实现了API模块和实现模块分离，包含2个jar包，一个log4j-api.jar（对外提供api，主要包含Logger 类和LogManager类）,另一个log4j-core.jar（实现日志记录功能的核心基础类）

1.6.2使用方式

①添加依赖

<dependency>
	<groupId>org.apache.logging.log4j</groupId>
    <artifactId>log4j-core</artifactId>
    <version>2.5</version>
</dependency>
<dependency>
	<groupId>org.apache.logging.log4j</groupId>
    <artifactId>log4j-api</artifactId>
    <version>2.5</version>
</dependency>

②代码

Logger logger = LogManager.getLogger(LogManager.ROOT_LOGGER_NAME);

③配置文件

<?xml version="1.0" encoding="UTF-8">
<Configuration status="WARN">
	<Appenders>
		<Console name="Console" target="SYSTEM_OUT">
			<PatternLayout pattern="%d(HH:mm:ss.SSS)[%t] %-5level %logger{36} - %msg%n/">
		</Console>
 </Appenders>
<Loggers>
	<Root level="info">
		<AppenderRef ref = "Console"/>
 	</Root>
</Configuration>

1.6.3 性能提升

通过在一个单独的线程里执行I/O操作来提高性能，实现方式：异步Appender 和异步Logger

异步Appender：内部通过ArrayBlockingQueue来实现，异步的线程从队列里取走日志事件并写入磁盘，每当队列为空时，会对缓冲的批量日志事件进行一次罗盘错字
异步Logger：目标是尽可能快的使打印日志的方法调用返回，Logger分为所有Logger全异步和同步与异步混合。异步Logger使用无所的Disruptor RingBuffer来实现。
- 异步配置：jvm启动参数：-DLog4jContextSelector=org.apache.logging.log4j.core.async.AsycLoggerContextSelector
- 异步同步混合：在配置文件中显示指定的或

2.日志系统的优化和最佳实践

2.1 开发人员的日志意识

开发时有意识的设想代码出现问题时的场景，记录关键程序运行信息
打印日志时必须包含环境信息，eg，用户id，角色参数返回值逻辑判断结果，循环次数等
对异常等错误信息必须打印错误级别及以上级别的日志，对线上日志要定期检查，没有异常日志产生的服务才是健康的服务。
生产环境将关闭的日志必须在打印日志前进行判断，以此来提高执行效率
必须使用占位符的方式代替字符串连接，这样程序更加简洁，并且性能有所提高
对关键业务步骤必须大点并记录耗时和结果等信息

2.2 日志级别的设置

QA环境可以使用debug及以下级别
刚上线的应用还没有到稳定期，使用debug级别
上线后稳定应用，使用info
常年不出现问题的应用使用error

对于不同情况应该使用的日志级别：

使用trace级别的日志输出最细粒度的信息事件，通过这些信息可以跟踪程序执行的任一步骤
使用debug级别日志输出细粒度的信息事件，这些信息对调试应用程序非常有用
info级别：输出粗粒度信息时间，突出强调应用程序运行的关键逻辑和过程
warn级别：输出可能出现的错误，或输出潜在发生错误的环境信息，或打印用户输入的非法信息
error级别：输出错误事件，但仍不影响系统的继续运行，发生异常一定要记录error日志并打印异常堆栈，异常在封装后抛出时一定要保留根源异常和错误信息，构成异常树。
fatal级别：严重的错误时间，将会导致应用程序的退出

2.3 日志的数量和大小

控制日志输出量，避免由于业务上量而导致服务器磁盘沾满并大量地输出无用的日志，不利于系统性能提升，也不利于快速定位错误点

不要随便把对象JSON序列化后打印出来，如果要打印，使用JSON格式打印会占用很大空间

单条日志不超过1KB

构建大数据日志系统时要有容错能力，遇到连续的大日志时可以采取抛弃的策略，避免出现内存占用过多的问题。

2.4 切割方式

使用脚本切割

cat app.log > app.'date'+%Y-%m-%d''.log
cat /dev/null > app.log

脚本首先通过cat文件把当前日志文件内容滚动存储到另外一个带日期后缀的日志文件中，然后清空当前的日志文件。

问题：

丢失一部分日志
打印到另一个文件中，会导致磁盘I/O瞬间迅速增加，在严重情况下会影响应用程序打印日志或进行磁盘I/O操作

推荐使用：日志框架原生的按照日期滚动的Appender来记录日志，在滚动周期结束后，会对当前日志文件重命名，然后生成新的日志文件。

2.5 日志格式的配置

Log4j通过配置可以显示不同的环境信息，常用内置环境信息

%p：输出日志信息的优先级：debug、info、warn、error、fatal
%d：输出日志时间点日期或时间：默认格式JSO8601，也可以指定格式
%r：输入自应用启动到输出该log信息所用的毫秒数
%c：输出日志信息所属的类目，通常就是所在类全名
%t：输出产生该日志事件线程名
%M：输出产生该日志的方法名
%l：输出日志事件的发生位置

2.6 一行日志导致的线上事故

线上运行良好的服务，在一次上线的过程中增加一行日志，导致这个服务的数据库连接池的连接出现用光的情况。

private void doSomething(......, Map param){
    log.debug("......" + param);
}

观察日志，线上服务开始偶发地报NullPointerException

查看线程的调用堆栈，是在一个领域模型的toString()方法报出来的

分析：增加日志导致NullPointerException，日志打印了Map内容，map包含这个对象，打印时需要将这个对象转为字符串，会调用对象的toString（）方法

只有字段domainObject1为空是会产生NullPointerException

问什么字段domainObject1会为空？ —数据来源分析
为什么会引起数据库连接池里面的连接用光？
- 上层处理业务逻辑中，手工拿到了数据库连接，遇到空指针并没有释放数据库连接，因此多个数据库连接被占用，最后数据库连接逐渐被用光，无法提供正常服务。

3.大数据日志系统的原理与设计

3.1 通用架构和设计

在这里插入图片描述

日志框架引用在应用服务上，产生的日志通常存储在本地文件里，按天或小时滚动产生日志文件。

采集器部署在每个应用服务器上，监控本地日志文件，获取新产生的内容，发送到对应缓冲队列节点
解析器集群监听缓冲队列集群，获取进入的日志处理，通常会把基于行的文本日志转换成JSON格式的数据，便于后续存储
解析器集群的节点将日志转成JSON格式，把日志存储在有序的存储系统中并建立索引，为后续客户端提供搜索服务。

3.2日志采集器

持续的收集和解析服务日志，收集服务器性能数据，并传输处理后的数据到后端系统。

3.2.1常见的日志采集器

（1）Logstash

开源的服务端数据处理管道，可以并发地从多个数据源获取数据，转换数据发送数据到一个数据存储或缓冲区。

从各个数据源收集数据后，Logstash可以快速的解析和转换日志数据，从原始数据中提取出字段的明值对形成结构化JSON。

Logstash通常会把处理后的结构化日志数据存储到搜索引擎中，可以为Logstash配置安全的传输通道，也可以使用安全的Elasticsearch集群，保证数据不泄露。

Logstash有200多个插件，可以组合匹配编排不同数据源，具有良好的扩展性。

Logstash具有容错性，任意节点出问题，会通过持久化处理的数据保存在内部的缓冲区中保证数据不会丢失，但可能会重复发送，内部有消息的缓冲区，big存储在硬盘中，本身有削峰能力。

（2）Fluentd

开源数据采集器，C和Ruby语言开发的轻量级系统，占用系统资源比较少，一般只占用30-40MB内存，单线程每秒可处理1.3万日志，可以统一收集日志数据，然后进行转换和存储，为使用者提供基础数据支持，帮助使用者做相应的决策。具有统一的JSON格式处理，可插拔的架构，轻量级等特点。

（3）Flume

高可用的，高可靠的，分布式的海量日志采集，聚合，转换和传输的系统，通过定制化支持从各类日志源采集日志。同时支持TCP和UDP两种传输模式，然后对日志进行简单加工，再写到日志的存储系统中，并支持对输出目标进行扩展和定制。

（4）Scribe

能够从各种日志源收集日志，并存储到一个中央存储系统上，以便于集中统计，分析和处理，为它的使用者提供查询和搜索等功能，它提供了一套可扩展，可容错的方案，可在众多的应用服务器上分布式地收集日志，然后归集日志到统一的存储系统中。

当中央存储系统的网络或者机器出现故障时，Scribe会将日志暂存到本地磁盘，当中央存储系统恢复后，Scribe会将转存的日志重新传输给中央存储系统。----【容错性】

通常与Hadoop组合使用，用户向HDFS中存储日志，通过Hadoop的MapReduce任务对数据进行定时处理，然后将处理加工的数据指标存储到其他数据存储系统中，用于监控，报警或者通过日志展示系统来对外提供查询和搜索功能。

（5）Rsyslog

提供了高性能，安全和模块化等特性

3.2.2Logstash和Fluentd对比

支持平台：L-任何支持JVM的平台，F-Linux和Windows
传输方式：L-需配合Redis来提供稳定性，F-本身带有缓冲系统，有容错性，可用性，稳定性，只是需要使用者多花时间和心思在配置上即可实现高效的日志采集器
性能：L-会用更多内存，对于大量的服务节点可以使用Filebeat来代Logstash，F-会用更少的内存，可以用Fluent Bit 和Fluented Forwarder实现更轻量器架构。
插件系统：最大的不同是管理插件的方式。L-Gitub库管理插件。F-没有一个中心管理插件，
事件路由方式：L-使用可编程的方式进行事件路由，F-标记配置的方式路由。

3.2.3日志采集的最佳实践

断点续采，采集器存储文件指纹及行位置到本地的一个文件中，文件指纹通常指文件的inode，即使文件重命名，文件的inode也不会发生变化，因此采集器通常追踪的是文件的inode信息和行号，文件名修改并不影响inode信息，只是影响了它所在的文件目录的信息，但是如果文件被压缩后，inode实际发生了改变，则文件已经成为另外一个文件了，需手工处理。