1.Solr简介
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
优点:Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。
solr官网:http://lucene.apache.org/solr/
2>solr文件夹结构
bin:solr的运行脚本
example/solr:该目录是一个包含了默认配置信息的Solr的Core目录(一个solrhome)
example/webapps:该目录中包括一个solr.war,该war可作为solr的运行实例工程
example/lib/ext:solr.war运行所需要的jar包
3>solr的运行环境
需要使用java1.7以上的运行环境,并且需要使用到tomcat容器
2.solr运行在tomcat上
window与linux相同,此处为使用linux命令
1>将solr和tomcat的.tar.gz压缩包上传到linux中,并解压到/usr/local/solr文件夹:tar -xvf xxx.tar.gz
2>把solr/example/webapps下的solr.war复制到tomcat/webapps下:cp -r solr.war tomcat/webapps
3>启动tomcat(解压solr.war),然后再关闭tomcat(bin下):./startup.sh、./shutdown.sh
4>把solr/example/lib/ext目录下的所有的jar包,复制到solr项目的lib:cp solr/example/lib/ext/* tomcat/webapps/solr/..lib
5>创建一个solrhome,solr/example下solr就是一个现成的solrhome,复制到tomcat同级目录即可
6>关联solr及solrhome,修改tomcat/webapps/solr/WEB-INF/web.xml,<env-entry>标签内的内容改为solrhome地址
7>启动tomcat,访问http://localhost:8080/solr就是solr的后台页面
3.solrj的使用
0>添加索引(添加域)
注意:添加的域必须有id这个域,域的名称必须是在solrhome/collection1/conf/schema.xml已经配置好Field标签
@Test
public void addDocument() throws SolrServerException, IOException{
//1.添加solr的jar包,
//2.创建一个SolrServer,使用HttpSolrServer创建对象,传入solr服务器地址linux
SolrServer solrServer = new HttpSolrServer("http://192.168.25.131:8080/solr/");
//3.创建一个SolrInputDocument对象
SolrInputDocument document = new SolrInputDocument();
//4.向文本域添加域。必须有id域,域的名称必须在schem.xml中已经配置的
document.addField("id", "001");
document.addField("item_title", "商品测试");
document.addField("item_price", "1999");
//5.把文档添加到所有索引库中
solrServer.add(document);
//6提交
solrServer.commit();
}
1>根据id删除
@Test
public void deleteDocumentById() throws Exception {
// 第一步:创建一个SolrServer对象。
SolrServer solrServer = new HttpSolrServer("http://192.168.25.131:8080/solr");
// 第二步:调用SolrServer对象的根据id删除的方法。
solrServer.deleteById("1");
// 第三步:提交。
solrServer.commit();
}
2>根据指定内容删除
@Test
public void deleteDocumentByQuery() throws Exception {
SolrServer solrServer = new HttpSolrServer("http://192.168.25.131:8080/solr");
solrServer.deleteByQuery("title:change.me");
solrServer.commit();
}
3>根据id查询
@Test
public void queryDocument() throws Exception {
// 第一步:创建一个SolrServer对象
SolrServer solrServer = new HttpSolrServer("http://192.168.25.131:8080/solr");
// 第二步:创建一个SolrQuery对象。
SolrQuery query = new SolrQuery();
// 第三步:向SolrQuery中添加查询条件、过滤条件。。。
query.setQuery("*:*");
// 第四步:执行查询。得到一个Response对象。
QueryResponse response = solrServer.query(query);
// 第五步:取查询结果。
SolrDocumentList solrDocumentList = response.getResults();
System.out.println("查询结果的总记录数:" + solrDocumentList.getNumFound());
// 第六步:遍历结果并打印。
for (SolrDocument solrDocument : solrDocumentList) {
System.out.println(solrDocument.get("id"));
System.out.println(solrDocument.get("item_title"));
System.out.println(solrDocument.get("item_price"));
}
}
4>带高亮的复杂查询
@Test
public void queryDocumentWithHighLighting() throws Exception {
// 第一步:创建一个SolrServer对象
SolrServer solrServer = new HttpSolrServer("http://192.168.25.154:8080/solr");
// 第二步:创建一个SolrQuery对象。
SolrQuery query = new SolrQuery();
// 第三步:向SolrQuery中添加查询条件、过滤条件。。。
query.setQuery("测试");
//指定默认搜索域
query.set("df", "item_keywords");
//开启高亮显示
query.setHighlight(true);
//高亮显示的域
query.addHighlightField("item_title");
query.setHighlightSimplePre("<em>");
query.setHighlightSimplePost("</em>");
// 第四步:执行查询。得到一个Response对象。
QueryResponse response = solrServer.query(query);
// 第五步:取查询结果。
SolrDocumentList solrDocumentList = response.getResults();
System.out.println("查询结果的总记录数:" + solrDocumentList.getNumFound());
// 第六步:遍历结果并打印。
for (SolrDocument solrDocument : solrDocumentList) {
System.out.println(solrDocument.get("id"));
//取高亮显示
Map<String, Map<String, List<String>>> highlighting = response.getHighlighting();
List<String> list = highlighting.get(solrDocument.get("id")).get("item_title");
String itemTitle = null;
if (list != null && list.size() > 0) {
itemTitle = list.get(0);
} else {
itemTitle = (String) solrDocument.get("item_title");
}
System.out.println(itemTitle);
System.out.println(solrDocument.get("item_price"));
}
}
4.SolrCloud(solr集群)
SolrCloud简介:是Solr提供的分布式搜索方案,在一个索引数据量少的说话说不需要使用的,当索引量很大,搜索请求并发很高的时候需要使用SolrCloud来满足这些需求。
SolrCloud是基于Solr和Zookeeper的分布式搜索方案,主要思想是使用Zookeeper作为集群的配置信息中心。
2>Solr集群的系统架构
3>需要实现的solr集群架构
4>使用集群版的solr
添加文档:
@Test
public void testSolrCloudAddDocument() throws Exception {
// 第一步:把solrJ相关的jar包添加到工程中。
// 第二步:创建一个SolrServer对象,需要使用CloudSolrServer子类。构造方法的参数是zookeeper的地址列表。
//参数是zookeeper的地址列表,使用逗号分隔
CloudSolrServer solrServer = new CloudSolrServer("192.168.25.131:2181,192.168.25.131:2182,192.168.25.131:2183");
// 第三步:需要设置DefaultCollection属性。
solrServer.setDefaultCollection("collection2");
// 第四步:创建一SolrInputDocument对象。
SolrInputDocument document = new SolrInputDocument();
// 第五步:向文档对象中添加域
document.addField("item_title", "测试商品");
document.addField("item_price", "100");
document.addField("id", "test001");
// 第六步:把文档对象写入索引库。
solrServer.add(document);
// 第七步:提交。
solrServer.commit();
}
查询文档:
@Test
public void testQueryDocument() throws Exception {
//创建一个CloudSolrServer对象
CloudSolrServer cloudSolrServer = new CloudSolrServer("192.168.25.131:2181,192.168.25.131:2182,192.168.25.131:2183");
//设置默认的Collection
cloudSolrServer.setDefaultCollection("collection2");
//创建一个查询对象
SolrQuery query = new SolrQuery();
//设置查询条件
query.setQuery("*:*");
//执行查询
QueryResponse queryResponse = cloudSolrServer.query(query);
//取查询结果
SolrDocumentList solrDocumentList = queryResponse.getResults();
System.out.println("总记录数:" + solrDocumentList.getNumFound());
//打印
for (SolrDocument solrDocument : solrDocumentList) {
System.out.println(solrDocument.get("id"));
System.out.println(solrDocument.get("title"));
System.out.println(solrDocument.get("item_title"));
System.out.println(solrDocument.get("item_price"));
}
}