elasticsearch
文章平均质量分 80
行走江湖
方向:分布式计算、实时流计算、数据挖掘、后台开发、NoSQL、Hadoop/HBase、Unix/Linux、Java、C/C++、Python。
联系方式:http://t.qq.com/X-L2008
QQ:394102339
展开
-
ElasticSearch安装ik分词插件
一、IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开 始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。转载 2014-07-17 20:16:08 · 860 阅读 · 0 评论 -
ElasticSearch字段排序
需求如果我们需要根据一个字段进行排序,如何支持呢?像日期、价格这些数值型的(日期底层其实是转换为数值),排序其实是很自然也是很简单的。但是如果是字符串类型的字段呢?有几个问题需要考虑:分词对排序的影响大小写、单复数之类区别字符串类型的字段一般都需要进行搜索的,那么需要对其进行Analyzed。但是Analyzed的结果就是将该字符串解析为分散的token(term)。这样子,E转载 2014-10-16 14:49:11 · 9424 阅读 · 0 评论 -
Elasticsearch 的坑爹事——记录一次mapping field修改过程
团队使用Elasticsearch做日志的分类检索分析服务,使用了类似如下的_mapping{ "settings" : { "number_of_shards" : 20 }, "mappings" : { "client" : { "properties" : { "ip" : {转载 2014-11-01 11:58:39 · 2870 阅读 · 0 评论 -
es分布式 索引复制异常:org.elasticsearch.transport.RemoteTransportException: Failed to deserialize exception
[java] view plaincopyorg.elasticsearch.transport.RemoteTransportException: Failed to deserialize exception response from stream Caused by: org.elasticsearch.transport.TransportSeria转载 2014-07-30 18:54:10 · 5591 阅读 · 0 评论 -
生产环境使用elasticsearch遇到的一些问题以及解决方法(不断更新)
1.由gc引起节点脱离集群 因为gc时会使jvm停止工作,如果某个节点gc时间过长,master ping3次(zen discovery默认ping失败重试3次)不通后就会把该节点剔除出集群,从而导致索引进行重新分配。解决方法:(1)优化gc,减少gc时间。(2)调大zen discovery的重试次数(es参数:ping_retries)和超时时间(es参数:p转载 2014-07-31 12:19:36 · 1177 阅读 · 0 评论 -
Lambda架构
Hadoop框架带来了批量数据处理,但是网络规模大数据的实时处理仍然是一个挑战。 有很多技术可以用来建立这样一个完整的数据处理系统 - 但要选择合适的工具并且编排使用它们却是复杂和艰巨的。Nathan Marz将任何数据系统都可定义为:“query = function(all data)”Lambda系统架构定义了一套明确的架构原则,如果要建立一套强大的和可扩展的数据系统转载 2014-07-13 10:41:49 · 1059 阅读 · 0 评论 -
ElasticSearch的安装和相关插件的安装
本文主要介绍如下内容: 1、ElasticSearch的安装(Windows 和 Linux) 2、ElasticSearch插件安装 3、ElasticSearch源码集成到Eclipse 1、ElasticSearch的安装 1)Windows环境转载 2014-07-01 23:05:33 · 580 阅读 · 0 评论 -
GitHub使用elasticsearch遇到的一些问题及解决方法
GitHub使用elasticsearch遇到的一些问题及解决方法GitHub此前的搜索使用Solr实现,新上线的搜索基于elasticsearch,运行在多个集群上。由于代码搜索索引很大,GitHub专门为其指定了一个集群。目前该集群包括26个存储节点和8个客户端节点。存储节点负责保存构成搜索索引的数据,而客户端节点负责协调查询活动。每个搜索节点中有2TB的SSD存储。转载 2014-05-29 13:11:46 · 1399 阅读 · 0 评论 -
ElasticSearch: Java API
ElasticSearch provides Java API, thus it executes all operations asynchronously by using client object. Client object can execute the operations in a bulk accumulatively.Java API can be used interna转载 2014-07-01 22:58:10 · 1257 阅读 · 0 评论 -
Kibana和logstash快速搭建实时日志查询、收集与分析系统
Logstash是一个完全开源的工具,他可以对你的日志进行收集、分析,并将其存储供以后使用(如,搜索),您可以使用它。说到搜索,logstash带有一个web界面,搜索和展示所有日志。kibana 也是一个开源和免费的工具,他可以帮助您汇总、分析和搜索重要数据日志并提供友好的web界面。他可以为 Logstash 和 ElasticSearch 提供的日志分析的 Web 界面说到这里,我们转载 2014-05-27 17:37:08 · 815 阅读 · 0 评论 -
用 elasticsearch 和 logstash 为数十亿次客户搜索提供服务
今天非常高兴的欢迎我们的第一个外来博主,Rackspace软件开发工程师,目前为Mailgun工作的Ralph Meijer。我们在 Monitorama EU 会面后,Ralph 提出可以给我们写一篇 Mailgun 里如何使用 Elasticsearch 的文章。他本人也早就活跃在 Elasticsearch 社区,经常参加我们在荷兰的聚会了。Mailgun 收发大量电子邮转载 2014-05-27 17:22:06 · 2081 阅读 · 0 评论 -
ElasticSearch的各种服务的URL(转)
前言elasticsearch 将各种功能、配置、服务都以API的形式暴露,这也是elasticsearch区别于其他搜索引擎框架的一个特征。这几天在看一个elasticsearch的培训资料,将资料中提到的URL单独罗列了出来。索引相关URL说明/index/_search不解释/_aliases获取或操作索引的别名转载 2014-05-27 14:46:06 · 859 阅读 · 0 评论 -
ElasticSearch 原理笔记
设计原理看ElasticSearch作者Shay Banon的PPT就可以了 The Road to a Distributed, (Near) Real Time, Search EngineShay Banon - @kimchyhttps://speakerdeck.com/kimchy/the-road-to-a-distributed-search-eng转载 2014-05-27 14:41:24 · 1423 阅读 · 0 评论 -
ElasticSearch入门笔记
lasticSearch 是构建在Apache Lucene之上的的搜索引擎服务,开源(Apache2协议),分布式,RESTful。安装方便,使用简单。官方站点:http://www.elasticsearch.com/中文站点:http://es-cn.medcl.net/1.安装必须先安装Java环境,并设置 JAVA_HOME => C:\Program Fil转载 2014-05-27 14:03:38 · 659 阅读 · 0 评论 -
Mapping WordPress Posts to Elasticsearch
I thought I’d share the Elasticsearch type mapping I am using for WordPress posts. We’ve refined it over a number of iterations and it combines dynamic templates and multi_field mappings along with转载 2015-01-21 22:07:50 · 785 阅读 · 0 评论