[置顶] MapReduce编程(六) 从HDFS导入数据到Elasticsearch

Elasticsearch for Hadoop安装以及如何从HDFS导入数据到Elasticsearch...
阅读(3784) 评论(5)

[置顶] Elasticsearch整合Mysql新闻搜索

Elasticsearch整合Mysql,实现数据导入、全文搜索、搜索高亮、结果分页...
阅读(1432) 评论(19)

[置顶] [搜索]Lucene仿百度文库文件检索系统

一、准备文件2016中国人工智能大会 顶尖专家齐聚.pptx 2016中国人工智能大会 大咖云集探讨人工智能.doc 2016中国人工智能大会在京召开.docx JavaScript闭包详解.docx 如何使用JSON.doc 中国人工智能大会CCAI 2016圆满落幕.pdf 中科院副院长:人工智能 找风口不如找关口.txt 二、搜索框三、搜索结果页声明: 本博客拒绝转载!...
阅读(2353) 评论(9)

[置顶] scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)

一、选题工程类搜索型: 定向采集 3-4 个新闻网站, 实现这些网站信息的抽取、索引和检索。网页数 目不少于 10 万条。能按相关度、时间、热度 (需要自己定义) 等属性进行排序, 能实现相似 新闻的自动聚类。 要求: 有相关搜索推荐、snippet 生成、结果预览 (鼠标移到相关结果, 能预览) 功能 二、项目线上访问地址 项目访问地址:http://120.27.46.201...
阅读(8083) 评论(11)

Linux文件权限总结

一、用户组和用户Linux是一个多用户、多任务环境,如下图,GroupA代表一个用户组,GroupB代表一个用户组,root是超级用户。Linux中,任何一个文件都有User、Group和others3种身份的级别。以UserB为例,UserB属于GroupA,UserE相对于UserB就是others。二、文件属性查看文件属性的命令:ls -al在一个文件夹下使用上述命令:返回结果从左到右一共有7...
阅读(85) 评论(0)

elasticsearch聚合案例--分组、求最大值再求最大值的均值

#一、需求 A、B、C代表3个用户,第二列代表各自的得分,求A、B、C的最好成绩以及A、B、C最好成绩的均值A 10 A 11 A 13 B 11 B 11 B 12 C 10 C 10 C 11 C 15二、思路先terms分组,求最大值,最后加一个pipeline均值。一开始想用bucket_script解决,实验发现走不通,但是bucket_script在聚合结果之上操作很有用三、测试数据P...
阅读(161) 评论(0)

Java正则表达式

java正则表达式工具与总结...
阅读(78) 评论(0)

Elasticsearch压力测试工具-Apache Jmeter

一、下载Jmeter下载地址:http://jmeter.apache.org/download_jmeter.cgi解压之后运行:/apache-jmeter-3.2/bin ./jmeter二、添加线程组依次店测试计划->添加->threads->线程组:在线程组中添加线程数和用户数,模拟用户访问: 10个用户,每个用户200个线程,循环10次。三、添加请求在线程组下,依次添加->Samp...
阅读(395) 评论(0)

Elasticsearch 5.4 Query DSL

Elasticsearch提供了丰富的查询语句DSL,查询可分2类: Leaf Query:查询特定字段特定值的查询,可以单独使用,比如match查询、term查询、range查询。 Compound Query:组合查询,组合多个简单查询或者特殊查询。先占坑,有时间更新Y(^_^)Y...
阅读(161) 评论(0)

IntelliJ IDEA For Mac 快捷键

IntelliJ IDEA For Mac 快捷键 Mac键盘符号和修饰键说明 一Editing编辑 二SearchReplace查询替换 三Usage Search使用查询 四Compile and Run编译和运行 五Debugging调试 六Navigation导航 七Refactoring重构 八VCSLocal History版本控制本地历史记录 九Live Templates动态代码模板...
阅读(154) 评论(0)

LeetCode Array

LeetCode数组习题26.Remove Duplicates from Sorted Array题目描述:Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length. Do not allocate extra spac...
阅读(261) 评论(0)

Elasticsearch 5.4 Documents API

ELasticsearch文档的CRUD主要包括以下2个大的方面:单文档和多文档,翻译如下:一、单文档API1.1 Index API写入文档,索引为twitter,type为tweet,id为1:PUT twitter/tweet/1 { "user" : "kimchy", "post_date" : "2009-11-15T14:12:12", "message" :...
阅读(425) 评论(0)

Elasticsearch 5.4 Indices(索引) API

前言 一索引管理 1 创建索引 2 删除索引 3 查看索引信息 4 索引是否存在 5 关闭打开索引 6 索引收缩 7 翻滚索引 二mapping管理 1 设置mapping 2 查看mapping 3 获取字段mapping 4 类型是否存在 三别名管理 1 索引别名设置 四索引配置 1 获取索引设置 2 更新索引设置 3 分析器 4 索引模板 五监控管理 1 索引统计信息 2 索引段 3 索引恢复...
阅读(322) 评论(0)

Elasticsearch 5.4 Mapping详解

前言 一Field datatype字段数据类型 1string类型 2 text类型 3 keyword类型 4 数字类型 5 Object类型 6 date类型 7 Array类型 8 binary类型 9 ip类型 10 range类型 11 nested类型 12token_count类型 13 geo point 类型 二Meta-Fields元数据 1 _all 2 _field_nam...
阅读(1563) 评论(0)

Spring全家桶(九)Spring JdbcTemplate

一、Spring JDBCSpring JDBC是在JDBC API的基础上定义一个抽象层,用以简化JDBC操作。Spring JdbcTemplate是Spring JDBC框架的核心,为不同类型的JDBC操作提供模板方法,每个模板方法都能控制整个过程,并允许覆盖过程中的特定任务。基于此,可以在保留灵活性的情况下,将数据库存取的工作量降到最低。二、Bean配置在Spring配置文件中,配置一个Sp...
阅读(589) 评论(0)

Spring全家桶(八)AOP核心思想与AspectJ 5种类型通知

一、AOP核心思想AOP是Aspect-Oriented Programming的缩写,翻译为面向切面编程。我个人理解切面就是一个方面。 例子,一个接口里面有增删改查四个方法:package com.stuspring.aop.impl;/** * Created by bee on 17/5/15. */ public interface ArithmeticCalculator {...
阅读(392) 评论(0)

Spring全家桶(七)通过注解配置Bean

Spring是简化j2ee开发的一个框架,通过指定id、类名配置bean虽然简单,但是当bean很多的时候,spring的配置文件会过于臃肿,使用注解技术配置bean使配置更加简介。一、注解配置bean步骤注解配置bean的原理是组件扫描,通过在spring配置文件中定义包扫描器,spring就能从classpath下自动扫描、侦测和实例化具有特定注解的bean。Spring注解有以下四个,位于or...
阅读(349) 评论(0)

Spring全家桶(六)必知必会的java注解技术

一、Java注解技术的基本概念Java注解又称Java标注,通俗的说注解就是对某一事物添加注释说明,是Java 5.0版本开始支持加入源代码的特殊语法元数据。Java语言中的类、方法、变量、参数和包都可以被标注,Java标注可以通过反射获取标注内容。在编译器生成类文件是,标注可以嵌入到字节码中。Java虚拟机可以保留标注内容,在运行时可以获取到标注内容。注解提供了安全的类似注释的机制,用来将任何的信...
阅读(355) 评论(0)

Spring全家桶(五)Bean的多种配置方法

十一、工厂方法配置Bean通过全类名方法配置Bean底层采用的是反射,除此之外还可以通过工厂方法(静态工厂方法&实例工厂方法)、FactoryBean来配置Bean。静态工厂方法创建Bean是将对象创建的过程封装到静态方法中,当客户端需要对象时,只需要简单地调用静态方法而不需要关系创建对象的细节。 要声明通过静态方法调用Bean,需要在Bean的class属性里指定该工厂的方法的类,同时在fact...
阅读(297) 评论(0)

Spring全家桶(四)Bean的生命周期

十、Bean生命周期10.1 Bean的生命周期Spring IOC容器可以管理Bean的生命周期,也允许在Bean生命周期的特定点执行定制的任务。Spring IOC容器对Bean的生命周期进行管理的过程如下: 通过构造器或者工厂方法创建Bean实例 为Bean的属性设置值和对其他Bean的引用 调用Bean的初始化方法 使用Bean 容器关闭时,调用Bean的销毁方法 在Bean的声明里设置in...
阅读(276) 评论(0)

Spring全家桶(三)Spring SpEL

九、SpELSpEL是Spring表达式语言(Spring Expression Language)的简称,是一个支持运行查询和操作对象图的强大的表达式语言。SpEL的语法类似EL,SpEL使用#{}作为界定符,所有在大括号内的字符都将被认为是SpEL。SpEL为bean的属性进行动态赋值提供便利。通过SpEL可以实现以下内容: 通过bean的id对bean进行引用 调用方法以及引用对象中的属性 计...
阅读(276) 评论(0)

Spring全家桶(二)Bean之间的关系、自动装配、作用域和使用外部文件

五、Bean的自动装配Spring IOC容器可以自动装配Bean,需要在bean的autowire属性里指定自动装配的模式。 <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001...
阅读(337) 评论(0)

Spring全家桶(一)HelloWorld与入门基础

Spring学习笔记一:理解Spring特点、IOC和DI以及入门例子...
阅读(391) 评论(0)

终端会话管理工具tmux

今天发现了一个好用的Linux工具-Tmux,用于在终端中管理多个会话窗口。捯饬了一会效果如下:图一:在一个窗口中启动ELasticsearch、head插件、Kibana图2:一个窗口中登录四台Linux服务器下面简介一下安装步骤和窗口分隔的命令。一、安装Ubuntu安装命令:sudo apt-get install tmuxMac安装命令:brew install tmux安装完成以后在终端中输...
阅读(301) 评论(0)
197条 共10页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:527820次
    • 积分:6506
    • 等级:
    • 排名:千里之外
    • 原创:189篇
    • 转载:2篇
    • 译文:6篇
    • 评论:322条
    欢迎加入QQ群
    Lucene、ES、ELK开发交流
    StackOverFlow
    http://stackoverflow.com/users/6526424
    统计
    博客专栏
    文章分类
    最新评论