javaee
文章平均质量分 81
zmark_zgc
java
展开
-
Luncene
这是第一次在csdn上写技术博客,就从Lucene开始吧。 对于Lucene这个工具来说的话,最重要的就是采集数据,把数据封装到文档对象中去,导入jar包这些我就不多说了,我用到的版本是4.10.3的。要了解Lucene要了解他的原理图。 索引流程:采集数据—》文档处理存储到索引库中 搜索流程:输入查询条件—》通过lucene的查询器查询索引—》从索引库中取出结—》视图渲染Lucene本身原创 2017-07-03 18:02:06 · 874 阅读 · 0 评论 -
Lucene(2)搜索
在上一个文章中讲到了怎么创建一个索引到本地的磁盘,具体的目录结构如下所示:接下来要介绍的是lucene怎么搜索: 在这里首先有一个非常重要的概念了,那就是分词! 分词有两个步骤:1.分词 2.过滤 一点都不让人感到意外的分词:将field域中的内容一个个的分词。 过滤:将分好的词进行过滤,比如去掉标点符号、大写转小写、词的型还原(复数转单数、过去式转成现在式)、停用词过滤停用词:单独应用没有特原创 2017-07-04 18:27:38 · 202 阅读 · 0 评论 -
lucene 3(相关度排序)
相关度排序这个东西顾名思义,在上文中我们讲到了一个打分的问题,就是说的在查询关键字匹配的时候,相识度越高的就会打分越高,就会越靠前。 打分的两个步骤:1.根据词计算词的权重。 2.根据词的权重打分。 词的权重:意思就是词的重要性,而且词就是我们上文讲到的term,而影响词的权重的有两个东西:TF:词在该文档中出现的频率 DF:词在多个文档中出现的频率到了现在大家都应该知道了,TF越高,DF越低原创 2017-07-05 10:55:19 · 384 阅读 · 0 评论 -
solr 全文检索服务器
Solr和lucene有什么区别了? 首先Solr是一个服务器,而lucene只是一个工具包,说到了服务器那么首先需要做的事情就是配置服务器了。 1.solr是apache的顶级的开源项目!!!是java开发的,是基于lucene的全文检索,solr相比较而言提供了更多的查询语句,性能也有所优化,具体的优化还是需要参考源代码的。2.solr的索引流程:客户端(浏览器)–post请求-》服务端原创 2017-07-08 08:30:45 · 335 阅读 · 0 评论 -
nosql
nosql是非关系型数据库。 非关系型数据库的优点 1.简单的扩展(以键值对的方式进行的存储,结构比较的灵活) 2.快速的读写() 3.低廉的成本 4,灵活的数据模型缺点: 1.不提供sql语句的支持 2.支持的特性不够丰富(没有事务的概念) 3.现有的产品不是很成熟(相对与关系数据库) 特点 支持完全索引的,包括内部的对象 支持复制和故障的恢复 (文件的存储格式是)BS原创 2017-08-19 15:06:39 · 831 阅读 · 0 评论 -
java性能优化
在这里首先要说到的是二八原则,那就是20%的代码和程序设计影响了系统80%的性能,也就是说的话如果我们把代码设计好就可以优化80%的性能。 在优化中又开始分3个层次,基础技术,构架方面,层次方面。在构架方面就要提到一个就是数据镜像:数据镜像的好处就是可以实现负载均衡,把一个服务器上的数据库压力放在多台上来。也可以达到了复用性和一致性,是解决HA的有效的方法。 (HA)是指尽量的减少银系统维原创 2017-08-14 19:26:06 · 202 阅读 · 0 评论