ES基础信息记录
bin---含有运行ES实例和管理插件的一些脚本
config---主要是一些设置文件,如elasticsearch.yml 和logging.yml
lib---包含相关的包文件
plugins---包含相关插件文件
logs---日志文件
data---es存放数据的位置
works---临时文件
关闭ES,http接口请求 http://localhost:9200/_cluster/nodes/_shutdown
logging.yml文件定义了多少信息写入日志系统,定义日志文件,并定期创建新文件,监控环境,备份解决方案,系统调试。
ES插件,数据同步插件,中文分词插件,hadoop插件,脚本支持插件,基础服务用插件是一个比较好的应用场景。
Cluster是对外提供搜索服务的集群,组成集群的各节点叫node是ES的运行实例。Node氛围,IndexNode(读写)和DataNode(数据存储访问,负载均衡),shards将es的完整索引分为若干部分,每个部分就是shards,shards存储在不同的或相同的node上,shards的创建一般是在索引创建前指定,并且索引创建后不能更改。ES会将查询发送给不同的Shards上并将返回结果合并。
Replicase是索引的冗余备份,可用于防止数据丢失或用于负载均衡。
Recovery是在有节点Node加入或者退出集群Cluster或故障节点重新启动时,ES对索引分片Shards进行重新分配。
River是运行在ES内部的插件,主要用于获取外部异构数据,然后在ES中创建索引。消息插件,JDBC插件,Monogodb插件。
Gateway是ES索引数据快照的存储方式,ES集群重新启动的时候就会从Gateway中读取索引数据。Gateway支持多种快照放肆,本地文件系统,分布式文件系统等。
Discovery.zen自动发现和master阶段选举,可在config/elasticearch.yml(广播协议和多播协议,进行节点通信,也支持p2p交互)
Transport代表ES与客户端的交流方式。默认使用TCP协议进行交互,同时支持HTTP协议,Thrift,Servlet。Memcached,ZeroMQ等传输协议(插件形式)。
Index,Type,Document,Field等。Index是ES存储数据的地方类似Databases,Type类似Table,Document是一行数据,列是field,模式Schema类似映射Mapping。
Mapping定义索引下Type的字段处理规则,如索引如何建立,索引数据类型,是否保存原始索引Json文档,是否压缩原始Json文档,是否需要分词处理,如何进行分词处理,一个索引文件下能够存储不同映射(Mapping)的类型文件,mapping通过语句删除。