搜索文件的几种方式:
一、提取文件, 插入数据库text,使用like 查询。
使用poi或PageOffice提取文件内容文字
缺点:只适合数据量不大的情况
二、提取文件, 插入数据库text,创建文件索引。
select * from 表名 where match(content) against('a');
缺点:索引的长度有限制。必须添加4条以上。中文支持不好(前后模糊查询查不到,要用空格分隔才行)。经常出现的不会索引,查不到。
三、使用搜索引擎Elasticsearch
安装插件: ik 分词器 使用ik_smart或ik_max_word
安装插件:ingest-attachment(8+版本不用安装)
定义pipline
转化成 Base64 编码
上传文件