搜索
文章平均质量分 77
蒜蓉粉丝蒸扇贝
这个作者很懒,什么都没留下…
展开
-
Elasticsearch安装ik分词
elasticsearch是自带中文分词的, 但是基本上是每个单字的分, 效果不好。medcl大神的ik分词, 是专门的中文分词。更多信息,可参考 https://github.com/medcl/elasticsearch-analysis-ik1. 安装ik插件可以从 https://github.com/medcl/elasticsearch-analysis-ik/releas原创 2016-04-27 11:42:54 · 1433 阅读 · 0 评论 -
Elasticsearch入门的3个基本问题
elasticsearch(以下简称ES),的3个基本问题。1. ES 如何写入输入?2. 如何从ES读取数据?3. ES的性能优化1. 如何写入数据到ES?ES使用了2个端口9200和9300(默认),9200负责HTTP的请求,即REST apis。我们可以REST api将数据写入ES. 例如, 使用curl命令即可实现一个写入操作。curl -XPUT ht原创 2016-04-20 10:33:38 · 689 阅读 · 0 评论 -
ELK之Elasticsearch介绍及在搜索中的使用
ELK: Elasticsearch + Logstash + KibanaElasticsearch: 是一个分布式的、实时全文搜索及分析引擎;检索性能高效是最大的特色。Logstash: 是一个数据收集器,有丰富的插件(input/filter/output)。Kibana: 是一个基于Elasticsearch的web展示平台。Elasticsea原创 2016-06-06 15:39:50 · 4537 阅读 · 0 评论 -
Elasticsearch在生产环境中的优化
Elasticsearch在生产环境中, 需要做一系列的优化, 以达到最佳的性能。虽然网上有些优化的建议和经验, 但却不一定有效,下面就结合官网上的介绍和网上的一些指导加上自己在使用过程中的实际处理, 给出更加有说服力的一些意见和建议。官网的关于生产环境的部署的建议,https://www.elastic.co/guide/en/elasticsearch/guide/current/depl原创 2016-07-22 22:18:15 · 4193 阅读 · 0 评论 -
Elasticsearch中的segment理解
在Elasticsearch中, 需要搞清楚几个名词,如segment/doc/term/token/shard/index等, 其实segment/doc/term/token都是lucene中的概念。这样有助于更深入的了解和使用ES。document: 索引和搜索的主要数据载体,对应写入到ES中的一个doc。field: document中的各个字段。term: 词项,搜索时的一个原创 2016-10-11 17:20:53 · 12619 阅读 · 0 评论 -
Elasticsearch中refresh和flush的区别是什么
在ES中, 要保证被索引的文档能够立即被搜索到, 有两种方法:_refresh 或者_flush。那么二者的区别是什么呢?要搞懂这个问题, 就需要对ES中文档的索引过程有个了解。我们知道ES的索引数据是写入到磁盘上的。但这个过程是分阶段实现的,因为IO的操作是比较费时的。当一个文档进入ES的初期, 文档是被存储到内存里的,默认经过1s之后, 会被写入文件系统缓存,这样该文档原创 2016-11-03 14:05:37 · 10948 阅读 · 1 评论 -
Elasticsearch的script使用
从ES 1.4.3以后, inline script默认是被禁止的,但是可以使用file script的模式。{"query":{ "term": { "content": "中国" } }, "script_fields": { "test1": { "script": "doc['content']+原创 2016-04-25 17:21:51 · 29974 阅读 · 0 评论