Cloudera Search(是Apache Solr和 Apache Hadoop 生态系统的集成)现在对Solr Connections支持(作为5.9版本)备份和恢复。
在这篇文章中我们将讨论在Cloudera Search 内部备份的基本知识和灾难恢复能力。下一篇文章中我们将讨论Solr快照功能的设计 Hadoop生态系统的集成和公有平台(例如,亚马逊 AWS)。
对于大部分组织和最终用户来说数据可用性是至关重要的。大量的生产数据作为关键业务通过Cloudera Search提供服务。当然改变从未停歇过:升级,应用开发,配置的变化等,无论它是通过cloudera Search还是独立Solr长期以来对于组织降低风险一直都是一种挑战。
备份和恢复灾难的能力具体的解决了在Sorl里存储关键业务数据的后顾之忧。
怎么样恢复Search索引的意外情况,例如因为意外丢失了索引数据或者恶意管理操作(删除了一个集合)数据增加/减少(例如删除了一个或者多了一个)?
怎么样迁移现存的Solr索引到其他集群上去(在perm或云上)?
怎么样在Solr集群升级过程中减少风险?
备份过程中的允许管理员创建索引文件的独立副本并对Solr connection配置数据,对Solr connection态的任何后续改变(例如移动文件,删除索引文件或者改变connection配置)都不会影响备份的状态,作为灾难修复的一部分,还原操作要创建一个新的Solr connection然后通过Solr connection备份初始化到最初的状态。
备份操作如下所示
获取潜在Apache Lucene 相应索引的一致性和指定的时间点视图到Solr集合上备份,在Lucene术语中,这种索引一致性和时间点视图表示为索引提交。solr中的数据快照功能实施这一步是为了确保备