NoSQL 是否可以用来做日志中心 ?

咨询区

  • ikrain

请问大家在分布式程序中用 nosql 来做日志中心的经验?我做了一些研究,发现用 Mongodb 做日志中心是一个非常好的选择,而且我发现 log4net 对它也是直接集成的,比如: log4mongo-net

不知道大家可推荐这种方式?或者有其他一些类似的方式吗?

回答区

  • yamen

其实在可扩展程序中用 mongodb 做日志中心不是一个推荐的做法,严格来说日志中心整体解决方案中,它只是解决了存储这个单一case的问题。

一个强大的日志中心需要解决如下几个问题:

  1. 数据采集

  2. 数据转运

  3. 数据清洗

  4. 数据存储

  5. 数据查询

  6. 数据可视化

再回头看看mongodb只解决了第4点,针对这六点,我推荐的相关落地产品为:

  1. Filebeat

它解决了对数据源的采集和转运,如日志文件。

  1. Logstash

它解决了数据清洗,你可以用正则表达式。

  1. ElasticSearch

它解决了数据的存储和查询。

  1. Kibana

它解决了数据的可视化问题

值得一提的是,ElasticSearch 为了记录日志底层就用了当前最流行的nosql方式,这整体就是 Elastic 家族给出的解决方案。

  • Kazuki Ohta

我见过很多公司都用 Mongodb 来记录应用程序的日志,毕竟它的 无模式 真的是太吸引人了,而且 mongodb 还提供了 Capped Collection 特性,它的固定大小模式可以周期性的用新数据替换老数据。

为了能够对日志进行精细化分析,一般大家都会采用 Grouping 和 MapReduce,但它不是很快,尤其是 js 的单线程引擎决定了 MapReduce 只能跑在单线程上,所以这种开销是巨大的。

当用 mongodb 记录日志时,还有一个不可避免的问题就是 锁竞争,毕竟日志场景是海量写,即使 mongodb 是一种 fire-and-forget (发送即丢弃) 的模式,也会造成大量的写锁竞争,从而影响应用程序的性能并在一定程序上影响 aggregate 和 filter 这些查询操作。

一个通用做法是采用 日志采集组件,比如:Fluentd,Logstash,Flume,这些组件需要部署在每一个应用程序节点,并从摄取应用程序产生的日志,参考如下图:

30002590436bc31dfe929352a1ad0ef9.png

这些框架会缓冲日志并将日志批量写入到比如 Mongodb,PostgreSQL 等数据库中,这种做法相比直写的方式要高效的多。

Mongodb 还有一个问题在于当数据卷达到内存上限时,它的性能会急剧下降,可替换方案就是 Apache HadoopCassandra

点评区

其实在 mongodb 盛行的 14,15 年,曾经确实把 mongodb 当作缓存用,造成的后果就是特别吃内存,那时候还是 mongodb 3.0 之前的内存映射模式,后来被迫写了一个自动释放内存的服务。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值