论文地址:http://jmzhu.logpai.com/pub/pjhe_icws2017.pdf
Drain可以以流方式实时解析日志,为了加快解析过程,Drain使用了固定深度的解析树(请参见上图)
根节点为树的顶层,底层为叶子节点,其他层为内部节点。
根节点和内部节点用于搜索,叶子节点存储日志组(包含日志事件和日志对应的ID号)
Drain基于固定深度解析树步骤
步骤1,预处理:
通过正则增加解析准确性,例如:hdfs中,对block id处理,对数字处理,对ip处理
Receiving block blk_5792489080791696128 src: /10.251.30.6:33145 dest: /10.251.30.6:50010
处理完:
Receiving block <*> src: <*> dest: <