收集
- 实时日志分析系统的基本架构 (Flume+Kafka+Storm)
- LinkedIn百亿级实时日志分析系统架构演进 (ELK+Kafka)
- Hadoop应用、分布式架构、日志系统在Hadoop的应用及实现
- 【年度案例】Twitter高性能分布式日志系统架构解析 ( DistributedLog/BookKeeper)
- 基于Flume的美团日志收集系统(一)架构和设计 (Flume/Scribe+Kafka+HDFS)
- 中心化日志记录架构 (Scribe、Flume、Heka、Logstash、 Chukwa、fluentd、nsq、Kafka)
- 基于开源日志管理系统的设计与构建--构建数据中心一体化运维平台第四篇 (Elasticsearch、Logstash/Fluentd、Kibana)
- 京东流量日志准实时抽取架构 ( HDFS+HBASE)
- 滴滴业务实时监控系统架构及实践 (kafka+Druid+Samza+HDFS)
- 万亿级日志与行为数据存储查询技术剖析 (Hbase系、Dremel系、预聚合系、Lucene系)
- 容器时代的分布式日志架构 (Fluentd+HDFS)
- Flume日志收集分层架构应用实践
- 去哪儿网实时日志流处理系统的Alluxio异地存储实践
Hadoop
存储
- 日志系统之HBase日志存储设计优化 - VinoYang的专栏 - 博客频道 - CSDN.NET (HBase+Elasticsearch)
- Elasticsearch、MongoDB和Hadoop比较 - 简书
- HBase, Cassandra 性能测试 - 乖乖的日志 - 网易博客
- Cassandra vs MongoDB vs CouchDB vs Redis vs Riak vs HBase vs Couchbase vs Hypertable vs ElasticSearch vs Accumulo vs VoltDB vs Scalaris comparison :: Software architect Kristof Kovacs
- HBase vs Cassandra
- brianfrankcooper/YCSB: Yahoo! Cloud Serving Benchmark
- HBase数据同步到ElasticSearch的方案 - hengyunabc的专栏 - 博客频道 - CSDN.NET
- Elasticsearch vs. Hadoop For Advanced Analytics | Treasure Data Blog
- Hadoop vs. Elasticsearch for Advanced Analytics - DZone Big Data
- 海量日志数据存储用 elasticsearch 和 hbase 哪个好? - 知乎
- mysql - Small startup: Cassandra + Hadoop or ElasticSearch - Database Administrators Stack Exchange
- Why shouldn't I use Elasticsearch as my primary datastore? - Quora
- [翻译]HBase 架构101 –预写日志系统 (WAL)
- Lineland: HBase Architecture 101 - Write-ahead-Log
- eBay使用Hadoop和HBase成功构建下一代搜索
全文索引
- 主流全文索引工具的比较( Lucene, Sphinx, solr, elastic search) - sg552 - ITeye技术网站
- Lucene Sphinx 全文索引 对比 - 白及 - 博客频道 - CSDN.NET
- 横向对比ElasticSearch与Sphinx - 知乎专栏
- Elasticsearch和sphinx单机对比:性能、索引大小、索引速度等 – 德普微新文 -
- sphinx 与 Elasticsearch 索引速度对比 - Swift编程
- Cloudera Search: 轻松实现Hadoop全文检索_HadoopChina_新浪博客 (solr)
- Nutch加Hadoop集群搭建 - JavaMan_chen的专栏 - 博客频道 - CSDN.NET
日志分析
- 业务系统-kafka-Storm【日志本地化】 - 1 将日志文件打印到local - 止静
- 【STORM】Storm实时日志分析,动态阈值触发即时通讯报警(Docker实现)|赛克通博客
- 基于Flume+Kafka+ Elasticsearch+Storm的海量日志实时分析平台 - SDK.CN - 中国领先的开发者服务平台(对比EFK和ELK)
- 一共81个,开源大数据处理工具汇总(上)-36大数据
- 一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等-36大数据
- Graylog——日志聚合工具中的后起之秀 · TesterHome
- The 7 Log Management Tools You Need To Know | Takipi Blog
- Log Management: Graylog Vs ELK – JetRuby – Medium