![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Lucene
猴子敲代码
猴子胖成猩猩
展开
-
007 Lucene解析查询(与用query子类查询等效)
1、基础的查询语法,关键词查询:域名+“:”+搜索的关键字 content:java //查询content域里带有java这个term的 2、范围查询,域名+“:”+[最小值TO 最大值],范围查询在lucene中不支持数值类型,支持字符串类型。在solr中支持数值类型。 size:[1 TO 1000] //查询size域里从1~1000的的 3、组合条件查询 1)+条件1 +条件2:两个条件之间是并且的关系and +filename:apache +content:apache 2)+条件1条件...原创 2021-04-12 09:27:37 · 77 阅读 · 0 评论 -
006 Lucene在Java里增删改查(用query子类查询)
先放出两个工具方法:获取IndexWriter和IndexReader对象 /** * 获取一个指定路径IndexWriter对象 * * @param path 指定路径 * @return * @throws Exception */ private IndexWriter getIndexWriter(String path) throws Exception { //创建IndexWriter对象,4.10.3的与7.6.0创建方式都不一样 Directory dir原创 2021-04-12 09:26:19 · 137 阅读 · 0 评论 -
005 IK-analyzer添加搜狗词库
1:从搜狗下载选择的细胞词库,这里下载动漫区的火影忍者词库 http://pinyin.sogou.com/dict/ 2:用深蓝词库转换工具提取出txt文本,深蓝词库的下载地址 https://github.com/studyzy/imewlconverter/releases 转换后会获得这一的一个文件 3:用ultraedit将txt文本保存为无bom utf-8格式 从这里开始有歧义,先来看Lucene里怎么使用: 将文件名修改为后缀为.dic的英文名文件,丟到项目的配置文件夹中.原创 2021-04-12 09:24:04 · 330 阅读 · 0 评论 -
004.1 高版本Lucene使用Ik
方法1: 下载一个IK-analyzer的jar包(案例文件里有两个任选一个就行),然后执行下列命令,这里以IKAnalyzer6.5.0.jar为例 mvn install:install-file -Dfile=C:\Users\hp\Downloads\IKAnalyzer6.5.0.jar -DgroupId=com.lucene -DartifactId=ikAnalyzer -Dversion=6.5.0 -Dpackaging=jar-DgeneratePom=true 其中: C:\U原创 2021-04-12 09:21:54 · 223 阅读 · 0 评论 -
004 中文分词器IK-Analyzer
Lucene是apache的项目,本身不支持中文分词,所以咱们需要中文分词器 第三方的中文分词器有很多,这里采用IK-analyzer GoogleCode 开源项目 :http://code.google.com/p/ik-analyzer/,开发包下载地址:https://code.google.com/archive/p/ik-analyzer/downloads------需要翻墙 阿里云 > 教程中心 > java教程 > IK Analyzer 中文分词器:https原创 2021-04-12 09:20:05 · 346 阅读 · 0 评论 -
003 Lucene读取文档创建索引、与查询
根据文档创建索引案例: public void createIndex() throws Exception { //创建IndexWriter对象 Directory directory = FSDirectory.open(Paths.get("D:\\lucene-7.6.0\\BlackTv_demo", new String[0])); Analyzer analyzer = new StandardAnalyzer();//StandardAnalyz...原创 2021-04-12 09:16:57 · 189 阅读 · 0 评论 -
002 Lucene安装与Java整合
Lucene官网,在官网里直接下载:http://lucene.apache.org/ 推荐下载最新版本,但是从004文档开始为了使用中文分词器IK-Analyzer不得已用老版本的Lucene,历史版本的Lucene http://archive.apache.org/dist/lucene/java/ 下载完后解压到你想存放的目录,下面是Lucene里我们会用到的jar包maven的pom文件,实体的jar包在lucene的安装目录里也能找到(这里以7.6.0为例) <!--单元测试-原创 2021-04-12 09:13:58 · 276 阅读 · 0 评论 -
001 Lucene创建索引过程
Mysql、XML、JSON这些类型的数据都是结构化数据,一本小说、一篇文章是非结构化数据 Lucene官网:http://lucene.apache.org/ 放到索引库里的有索引和原始文档,通过索引来查询原始文档,因此索引库由索引和原始文档组成。 域(Field)就是属性,一个域存放一个属性 比如:从文件名拆分出来的Term和从内容中拆分出的Term,哪怕是同一个单词,也不是同一个Term。 正排索引结构:通过文档找内容;倒...原创 2021-04-12 09:04:08 · 145 阅读 · 0 评论