自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zsd_31的专栏

我就喜欢满天繁星

  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

原创 虚拟机下linux外网访问

1、Bridge模式(一切都跟host一样,只有ip不能与host相同) ip=192.168.39.222 netmask=255.255.252.0 gateway=192.168.39.254 DNS1=192.168.39.252 2、NAT模式(已经验证)首先在host中查看VMnet8的IP(e.g. 192.168.255.1). 启动VMware,点Edit下Virtual Net...

2018-04-23 10:00:12 1168

转载 Elasticsearch之中文分词器插件es-ik

前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程Elasticsearch之停用词Elasticsearch之中文分词器Elasticsearch之几个重要的分词器        elasticsearch官方默认的分词插件  1、elasticsearch官方默认的分词插件,对中文分词效果不理想。  比如,我现在,拿个具体实例来展现下,验证...

2018-04-17 20:34:16 2883

转载 Elasticsearch之几个重要的分词器

前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程Elasticsearch之停用词Elasticsearch之中文分词器 Elasticsearch的几个重要的分词器:                                后续博客Elasticsearch之中文分词器插件es-ik...

2018-04-17 20:14:57 6330

转载 Elasticsearch之中文分词器

前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程Elasticsearch之停用词  Elasticsearch的中文分词器  1、单字分词:    如:“我们是中国人”    效果:“我”“们”“是”“中”“国”“人”  2、二分法分词:按两个字进行切分。    如:“我们是中国人”,效果:“我们”、“们是”、“是中”、“中国”、“国人”。...

2018-04-17 20:12:00 256

转载 Elasticsearch的停用词

 前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程  Elasticsearch的停用词  1、有些词在文本中出现的频率非常高,但是对文本所携带的信息基本不产生影响。  2、英文    a、an、the、of  3、中文    的、了、着、是 、标点符号等  4、文本经过分词之后,停用词通常被过滤掉,不会被进行索引。  5、在检索的时候,用户...

2018-04-17 20:09:46 2842

转载 Elasticsearch之分词器的工作流程

 前提什么是倒排索引?Elasticsearch之分词器的作用   Elasticsearch的分词器的一般工作流程:  1、切分关键词  2、去除停用词  3、对于英文单词,把所有字母转为小写(搜索时不区分大小写)     后续博客Elasticsearch之停用词...

2018-04-17 20:06:56 394

转载 Elasticsearch之分词器的作用

 前提什么是倒排索引?     Analyzer(分词器)的作用是把一段文本中的词按一定规则进行切分。对应的是Analyzer类,这是一个抽象类,切分词的具体规则是由子类实现的,所以对于不同的语言,要用不同的分词器。(也就是说不同的分词器分词的规则是不同的!)    在创建索引时会用到分词器,在搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果。     后续博客Elast...

2018-04-17 20:04:49 1974

转载 什么是倒排索引?

见其名知其意,有倒排索引,对应肯定,有正向索引。     正向索引(forward index),反向索引(inverted index)更熟悉的名字是倒排索引。      在搜索引擎中每个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合(实际上在搜索引擎索引库中,关键词也已经转换为关键词ID)。例如“文档1”经过分词,提取了20个关键词,每个关键词都会记录它在文档中的出现次数和出现位置...

2018-04-17 19:57:55 11788 2

转载 ES索引存储原理

ES索引存储原理不变性写到磁盘的倒序索引是不变的:自从写到磁盘就再也不变。 这会有很多好处:不需要添加锁。不存在写操作,因此不存在多线程更改数据。提高读性能。一旦索引被内核的文件系统做了Cache,绝大多数的读操作会直接从内存而不需要经过磁盘。提升其他缓存(例如fiter cache)的性能。其他的缓存在该索引的生命周期内保持有效,减少磁盘I/O和计算消耗。当然,索引的不变性也有缺点。如果你想让新...

2018-04-17 17:55:05 1812

转载 Elasticsearch创建索引和映射结构详解

前言这篇文章详细介绍了如何创建索引和某个类型的映射。下文中[address]指代elasticsearch服务器访问地址(http://localhost:9200)。1       创建索引1.1     简单创建语句curl -XPUT [address]/blog1.2     带参数的创建语句curl -XPUT [address]/blog/ -d '{    "settings":{ ...

2018-04-17 17:51:53 700 1

转载 获得当前 RM 的 active 和 standby 状态

集群关系图:说明: 为了更加通俗的说明,笔者将两台运行 resourcemanager 进程的主机名抽象为 RM1 和 RM2,笔者更倾向 RM1 上的运行的是 active 状态的 resourcemanager 进程,RM2 上的运行的是 standby 状态的 resourcemanager 进程,而实际操作中,master5 就是这个 RM1 ,master52 就是这个 RM2。抽象主机...

2018-04-09 16:40:33 2418

转载 定时任务-在spring中配置quartz

原文引用地址:https://blog.csdn.net/tanqian351/article/details/53584737

2018-04-01 23:16:58 104

azkaban-common-0.1.0-SNAPSHOT.jar

解决azkaban使用腾讯企业邮箱发邮件失败问题,因为腾讯的企业邮箱是用smtps协议,也就是ssl , 端口是465,增加相关代码,并打包,经测试可以直接使用。 我的azkaban的版本是“3.84.10”。

2020-07-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除