[置顶] [搜索]ElasticSearch Java Api(一) -创建索引

ElasticSearch JAVA API官网文档:https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-docs-index.html一、生成JSON创建索引的第一步是要把对象转换为JSON字符串.官网给出了四种创建JSON文档的方法:1.1手写方式生成String json = "{" +...
阅读(52013) 评论(43)

[置顶] scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)

一、选题工程类搜索型: 定向采集 3-4 个新闻网站, 实现这些网站信息的抽取、索引和检索。网页数 目不少于 10 万条。能按相关度、时间、热度 (需要自己定义) 等属性进行排序, 能实现相似 新闻的自动聚类。 要求: 有相关搜索推荐、snippet 生成、结果预览 (鼠标移到相关结果, 能预览) 功能 二、项目线上访问地址 项目访问地址:http://120.27.46.201...
阅读(8882) 评论(11)

Elasticsearch 集群优化总结

一、硬件层面优化配置(1) 合理选择服务器。Elasticsearch的运行对JDK版本、Linux内核、最小内存等都有一定的要求,在安装部署集群之前需要选择和Elasticsearch版本匹配的的服务器配置,同时也要根据业务量做集群规划。(2)提高Linux系统应用程序最大打开文件数。在启动Elasticsearch集群以前,增大机器的最大文件数,可以避免数据导入高峰时期打开文件过多异常的发生。...
阅读(134) 评论(0)

Redis总结

Redis安装 、数据类型、Java API、基本命令...
阅读(171) 评论(0)

java作业调度框架Quartz

在软件开发中,很多时候需要在特定时间的时间执行某些操作,比如每天的凌晨三点、每周的周日、每个月的15号,Apache Quartz就是一个开源的作业调度框架,可以让计划的程序任务一个预定义的日期和时间运行。这篇博客记录一下Quartz的安装、重要概念和入门例子。一、Quartz下载Quartz官网:http://www.quartz-scheduler.org/以2.2.3版本为例,下载 Quart...
阅读(1793) 评论(6)

JVM运行时数据区和垃圾回收机制

最近参考各种资料,尤其是《深入理解Java虚拟机 JVM高级特性和最佳实践》,大牛之作。把最近学习的Java虚拟机组成和垃圾回收机制总结一下。你不会的都是新知识,学无止境,每天进步一点点。一、认识Java虚拟机在开始学Java之时,必做的一件事就是从Java官网下载并安装Java到我们的电脑之上,然后从HelloWorld开始走上编程的不归路。 上图中下载的Java安装包全称是Java SE De...
阅读(1208) 评论(5)

Java集合体系总结

Java集合体系总结,Iterator和ListIterator、ArrayList和LinkedList、HashSet和TreeSet、HashMap和TreeMap......
阅读(296) 评论(0)

Linux文件权限总结

一、用户组和用户Linux是一个多用户、多任务环境,如下图,GroupA代表一个用户组,GroupB代表一个用户组,root是超级用户。Linux中,任何一个文件都有User、Group和others3种身份的级别。以UserB为例,UserB属于GroupA,UserE相对于UserB就是others。二、文件属性查看文件属性的命令:ls -al在一个文件夹下使用上述命令:返回结果从左到右一共有7...
阅读(290) 评论(0)

elasticsearch聚合案例--分组、求最大值再求最大值的均值

#一、需求 A、B、C代表3个用户,第二列代表各自的得分,求A、B、C的最好成绩以及A、B、C最好成绩的均值A 10 A 11 A 13 B 11 B 11 B 12 C 10 C 10 C 11 C 15二、思路先terms分组,求最大值,最后加一个pipeline均值。一开始想用bucket_script解决,实验发现走不通,但是bucket_script在聚合结果之上操作很有用三、测试数据P...
阅读(788) 评论(2)

Java正则表达式

java正则表达式工具与总结...
阅读(269) 评论(1)

Elasticsearch压力测试工具-Apache Jmeter

一、下载Jmeter下载地址:http://jmeter.apache.org/download_jmeter.cgi解压之后运行:/apache-jmeter-3.2/bin ./jmeter二、添加线程组依次店测试计划->添加->threads->线程组:在线程组中添加线程数和用户数,模拟用户访问: 10个用户,每个用户200个线程,循环10次。三、添加请求在线程组下,依次添加->Samp...
阅读(850) 评论(0)

Elasticsearch 5.4 Query DSL

Elasticsearch提供了丰富的查询语句DSL,查询可分2类: Leaf Query:查询特定字段特定值的查询,可以单独使用,比如match查询、term查询、range查询。 Compound Query:组合查询,组合多个简单查询或者特殊查询。先占坑,有时间更新Y(^_^)Y...
阅读(481) 评论(0)

IntelliJ IDEA For Mac 快捷键

IntelliJ IDEA For Mac 快捷键 Mac键盘符号和修饰键说明 一Editing编辑 二SearchReplace查询替换 三Usage Search使用查询 四Compile and Run编译和运行 五Debugging调试 六Navigation导航 七Refactoring重构 八VCSLocal History版本控制本地历史记录 九Live Templates动态代码模板...
阅读(445) 评论(0)

LeetCode Array

LeetCode数组习题26.Remove Duplicates from Sorted Array题目描述:Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length. Do not allocate extra spac...
阅读(375) 评论(0)

Elasticsearch 5.4 Documents API

ELasticsearch文档的CRUD主要包括以下2个大的方面:单文档和多文档,翻译如下:一、单文档API1.1 Index API写入文档,索引为twitter,type为tweet,id为1:PUT twitter/tweet/1 { "user" : "kimchy", "post_date" : "2009-11-15T14:12:12", "message" :...
阅读(962) 评论(0)

Elasticsearch 5.4 Indices(索引) API

前言 一索引管理 1 创建索引 2 删除索引 3 查看索引信息 4 索引是否存在 5 关闭打开索引 6 索引收缩 7 翻滚索引 二mapping管理 1 设置mapping 2 查看mapping 3 获取字段mapping 4 类型是否存在 三别名管理 1 索引别名设置 四索引配置 1 获取索引设置 2 更新索引设置 3 分析器 4 索引模板 五监控管理 1 索引统计信息 2 索引段 3 索引恢复...
阅读(891) 评论(0)

Elasticsearch 5.4 Mapping详解

前言 一Field datatype字段数据类型 1string类型 2 text类型 3 keyword类型 4 数字类型 5 Object类型 6 date类型 7 Array类型 8 binary类型 9 ip类型 10 range类型 11 nested类型 12token_count类型 13 geo point 类型 二Meta-Fields元数据 1 _all 2 _field_nam...
阅读(3335) 评论(0)

Spring全家桶(九)Spring JdbcTemplate

一、Spring JDBCSpring JDBC是在JDBC API的基础上定义一个抽象层,用以简化JDBC操作。Spring JdbcTemplate是Spring JDBC框架的核心,为不同类型的JDBC操作提供模板方法,每个模板方法都能控制整个过程,并允许覆盖过程中的特定任务。基于此,可以在保留灵活性的情况下,将数据库存取的工作量降到最低。二、Bean配置在Spring配置文件中,配置一个Sp...
阅读(1070) 评论(0)

Spring全家桶(八)AOP核心思想与AspectJ 5种类型通知

一、AOP核心思想AOP是Aspect-Oriented Programming的缩写,翻译为面向切面编程。我个人理解切面就是一个方面。 例子,一个接口里面有增删改查四个方法:package com.stuspring.aop.impl;/** * Created by bee on 17/5/15. */ public interface ArithmeticCalculator {...
阅读(633) 评论(0)

Spring全家桶(七)通过注解配置Bean

Spring是简化j2ee开发的一个框架,通过指定id、类名配置bean虽然简单,但是当bean很多的时候,spring的配置文件会过于臃肿,使用注解技术配置bean使配置更加简介。一、注解配置bean步骤注解配置bean的原理是组件扫描,通过在spring配置文件中定义包扫描器,spring就能从classpath下自动扫描、侦测和实例化具有特定注解的bean。Spring注解有以下四个,位于or...
阅读(482) 评论(0)

Spring全家桶(六)必知必会的java注解技术

一、Java注解技术的基本概念Java注解又称Java标注,通俗的说注解就是对某一事物添加注释说明,是Java 5.0版本开始支持加入源代码的特殊语法元数据。Java语言中的类、方法、变量、参数和包都可以被标注,Java标注可以通过反射获取标注内容。在编译器生成类文件是,标注可以嵌入到字节码中。Java虚拟机可以保留标注内容,在运行时可以获取到标注内容。注解提供了安全的类似注释的机制,用来将任何的信...
阅读(549) 评论(0)

Spring全家桶(五)Bean的多种配置方法

十一、工厂方法配置Bean通过全类名方法配置Bean底层采用的是反射,除此之外还可以通过工厂方法(静态工厂方法&实例工厂方法)、FactoryBean来配置Bean。静态工厂方法创建Bean是将对象创建的过程封装到静态方法中,当客户端需要对象时,只需要简单地调用静态方法而不需要关系创建对象的细节。 要声明通过静态方法调用Bean,需要在Bean的class属性里指定该工厂的方法的类,同时在fact...
阅读(460) 评论(0)
196条 共10页1 2 3 4 5 ... 下一页 尾页
    QQ群

    1群: 370734940

    2群: 559831158

    个人资料
    • 访问:647471次
    • 积分:7257
    • 等级:
    • 排名:第3184名
    • 原创:188篇
    • 转载:2篇
    • 译文:6篇
    • 评论:390条
    StackOverFlow
    http://stackoverflow.com/users/6526424
    统计
    博客专栏
    文章分类
    最新评论