ElasticSearch Java Api(二) -检索索引库

上篇博客记录了如何用java调用api把数据写入索引,这次记录下如何搜索。一、准备数据 String data1 = JsonUtil.model2Json(new Blog(1, "git简介", "2016-06-19", "SVN与Git最主要的区别...")); String data2 = JsonUtil.model2Json(new Blog(2, "Java中泛...
阅读(13074) 评论(29)

[置顶] [搜索]ElasticSearch Java Api(一) -创建索引

ElasticSearch JAVA API官网文档:https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-docs-index.html一、生成JSON创建索引的第一步是要把对象转换为JSON字符串.官网给出了四种创建JSON文档的方法:1.1手写方式生成String json = "{" +...
阅读(55179) 评论(43)

ElasticSearch集群入门

一、下载与安装Elasticsearch 依赖 java,在安装 ES 之前首先要配好 java,这个默认我们的电 脑已经完成。 首先从 elasticsearch官网下载安装包,我们是 linux 系统,下载 tar 包比较方便。当前版本为2.3.3,下载地址:Elasticsearch 2.3.3下载 .下载完成之后解压tar文件:tar -zxvf elasticsearch-2.3.3....
阅读(9000) 评论(13)

Solr环境搭建

记录一下Solr环境搭建,基于Solr 4.6.0.一、配置Tomcat下载Tomcat 7.0.新建一个solr文件夹,解压tomcat到solr目录下:solr tar -zxvf apache-tomcat-7.0.69.tar 启动tomcat: ./apache-tomcat-7.0.69/bin/catalina.sh start访问8080端口测试。二、配置solrsolr下载地址:h...
阅读(2678) 评论(0)

mac命令行启动tomcat

一、修改授权进入tomcat的bin目录,修改授权➜ bin pwd /Users/yp/Documents/workspace/apache-tomcat-7.0.68/bin ➜ bin sudo chmod 755 *.sh sudo为系统超级管理员权限. chmod 改变一个或多个文件的存取模式 755代表用户对该文件拥有读、写、执行的权限,同组的其他人员拥有执行和读的权限,没有写的权限...
阅读(15658) 评论(0)

Grunt压缩、合并js/css文件

一、Grunt简介Grunt是一个基于命令的javascript工程命令行构建工具。 1. 官网:http://gruntjs.com/ 2. 中文网:http://www.gruntjs.net/ 在开发前端的时候,也就html、css、js三种,并不像其它编程语言需要管理很多模块、很多类,为什么要用构建工具?把代码放到服务器上的时候我们肯定是希望文件最小,加载的速度更快,我们自...
阅读(1473) 评论(0)

机器学习之朴素贝叶斯分类

贝叶斯概率在机器学习、自然语言处理中被广泛地应用,对于海量数据的文本分类问题(比如垃圾邮件的甄选和过滤),基于贝叶思的算法取得非常好的效果。一、概率基础概率:概率是某一事件或者预测行为的可信程度。取值在0-1之间。 比如,抛一枚硬币,正面朝上的可能性和反面朝上的肯能性是相等的,都是0.5.条件概率:条件概率是指在某些前提条件的概率问题。 比如,根据美国疾病控制中心美国每年大约有78.5万人罹患心脏病...
阅读(1296) 评论(0)

[置顶] scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)

一、选题工程类搜索型: 定向采集 3-4 个新闻网站, 实现这些网站信息的抽取、索引和检索。网页数 目不少于 10 万条。能按相关度、时间、热度 (需要自己定义) 等属性进行排序, 能实现相似 新闻的自动聚类。 要求: 有相关搜索推荐、snippet 生成、结果预览 (鼠标移到相关结果, 能预览) 功能 二、项目线上访问地址 项目访问地址:http://120.27.46.201...
阅读(9423) 评论(12)

MapReduce编程实例

需求输入文件:文本文件 每行格式: 3个部分由空格隔开 其中source和destination为两个字符串,内部没有空格 time为一个浮点数,代表时间(秒为单位) 涵义:可以表示一次电话通话,或表示一次网站访问等 输入可能有噪音: 如果一行不符合上述格式,应该被丢弃,程序需要正确执行 MapReduce计算:统计每对sourc...
阅读(1724) 评论(0)

adb shell查看sqlite数据库

android的数据持久化方案常用的有三种: 文件存储 SharedPreferences存储 SQLite数据库存储 文件存储路径为:data/data/包名/files SharedPreferences储路径为:data/data/包名/shared_prefs SQLite数据库存储路径为:data/data/包名/databases 文本和SharedPreferences文件可以...
阅读(1978) 评论(0)

MapReduce编程模型

MapReduce/HadoopMapReduce是目前云计算中最广泛使用的计算模型,由Google于2004年提出,谷歌关于云计算有三篇著名的论文: 《Bigtable_A Distributed Storage System for Structured Data》 《MapReduce: Simplied Data Processing on Large Clusters》 ......
阅读(3328) 评论(0)

Lucene 查询(Query)子类

QueryParser(单域查询)QueryParser子类对单个域查询时创建查询query,构造方法中需要传入Lucene版本号,检索域名和分词器。QueryParser parser = new QueryParser(Version.LUCENE_43, field, analyzer);// 查询字符串 Query query = parser.parse("key");MultiField...
阅读(4787) 评论(0)

Lucene查询结果高亮

检索结果高亮对于用户的体验度和友好度非常重要,可以快速标记出用户检索对关键词。本例中的索引仍使用上一篇博客( Lucene查询索引)中创建的索引,代码高亮参考了Lucene4.x高亮 fast高亮 前端高亮。实现效果:核心代码package ucas.ir.lucene;import java.io.File; import java.io.IOException;import javax.prin...
阅读(3216) 评论(5)

Lucene查询索引

Lucene简介和怎样创建索引可以参考我前面的两篇博客Lucene全文检索基础和Lucene创建索引,索引创建以后可以使用luke(使用和Lucene版本相对应的Luke版本,比如Lucene版本是4.3,那么使用4.3 版本的Luke)查看。索引创建以新闻文档为例,每条新闻是一个document,新闻有news_id、news_title、news_source、news_url、news_abs...
阅读(2191) 评论(1)

[Android]listview图文混排

一、效果图:二、代码实现2.1ListViewActivitypackage cn.ac.ucas.yp.uiwidgettest;import android.support.v7.app.AppCompatActivity; import android.os.Bundle; import android.view.View; import android.widget.AdapterView;...
阅读(1965) 评论(0)

[Android]activity详解

现在回头看看毕设做的安卓程序,不论从深度还是广度上对安卓开发都不够深入,这次从头复习,恰好遇到了一本让人欲罢不能的好书。 每一个安卓开发者都是从activity开始入门的,先整理一篇关于activity的知识点。 一、创建activity的步骤。 新建类继承自activity,新建layout xml文件,比如activity1.xml。重写onCreate方法: @Override...
阅读(635) 评论(0)

[j2ee]java中的xml操作

一、XML简介      xml是可扩展标记语言,主要用来标记数据、定义数据类型,非常适合万维网传输。       xml特点:    xml是一种标记语言,很类似HTML   xml的设计宗旨是传输数据,而不是显示数据   xml标签没有被预定义,需要自行定义标签   xml被设计为具有自我描述性   xml是W3C的推荐标准      xml和html对比:...
阅读(1655) 评论(0)

[大数据]本地文件拷贝到hdfs

创建文件夹: hadoop fs -mkdir /work 拷贝: hadoop fs -put /Users/yp/Documents/test.txt /work 打开http://localhost:50070/: Utilities->browse the file system,可以看到新建的文件夹: 点击文件夹,就可以看到新上传的文件:...
阅读(3330) 评论(0)

sublime安装package control及常用插件

sublime(官网:https://www.sublimetext.com/)是我比较喜欢的文本编辑器,使用非常顺手。这里记录下package control及常用插件的安装。一、安装package controlpackage control官网https://packagecontrol.io/installation,复制安装代码,在sublime菜单中找到view->show consol...
阅读(1074) 评论(0)

[J2EE]java操作json

一、JSON语法JSON:JavaScript 对象表示法(JavaScript Object Notation),JSON 是存储和交换文本信息的语法。类似 XML,但 比 XML 更小、更快,更易解析。 JSON 数据的书写格式是:名称/值对。 名称/值对包括字段名称(在双引号中),后面写一个冒号,然后是值:"firstName" : "John"JSON 数组在方括号中书写: 数组可包含...
阅读(3174) 评论(0)
200条 共10页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    QQ群

    交流群:559831158

    个人资料
    • 访问:702200次
    • 积分:7706
    • 等级:
    • 排名:第2952名
    • 原创:192篇
    • 转载:2篇
    • 译文:6篇
    • 评论:408条
    StackOverFlow
    http://stackoverflow.com/users/6526424
    统计
    博客专栏
    文章分类
    最新评论