Oracle单表千万数据量的模糊查询（地名地址查询）

最新推荐文章于 2023-04-25 09:19:12 发布

大白菜炒鸡蛋

最新推荐文章于 2023-04-25 09:19:12 发布

阅读量4k

点赞数 1

分类专栏：后端文章标签： oracle 全文检索数据库

本文链接：https://blog.csdn.net/qq_27808209/article/details/121116281

版权

后端专栏收录该内容

9 篇文章 0 订阅

订阅专栏

	首先说下需求:
		项目要求对接公安的地名地址的数据库，难点有3个吧
		1.公安的地名地址的数据库为Oracle的，我们项目用的是postgre
		2.给我们的数据文件是dmp的文件，1200W的数据量就有8G,全量导入和增量更新都是个问题
		3.文件导入后我们还需要在这1200W的数据中对某一个字段进行模糊查询
		下面进入正题：
			dmp导入oracle的过程我就不写在这里了，可以关注我的另外一篇帖子，今天这篇帖子只针对oracle，
	mysql的同理可得，都是针对索引进行优化，Oracle单表最大数据量支持到5000W，mysql的单表数据库能到1000w,
	如果单表数据量没有达到这个效果，其实是不需要进行分库分表的操作的。

		针对查询，提高查询效率的最直接有效的方法还是索引。普通的查询我们用普通索引或者是联合索引就能解决
问题了，很多时候需要根据key words关键字去匹配对应的值，对于大量的数据而已，如果使用like，或者instr函数，
速度则会很慢，这个时候，全文检索对比其他的模糊查询，有着明显的速度优势。但是因为分词，所以会占用的一定的空间。
如果空间足够以及对速度有一样的需求，可以考虑全文检索。根据自身的需求而定。

------------------这种查询可想而知，在这里我已经给DZ字段加上索引了，索引失效-----------------
select * from yourtable WHERE ADDRESS like '%苏州中心%' AND  ROWNUM <= 100;
下面我们开始给这张表加上全文索引
------------------1.查看用户-----------------
select * from dba_users WHERE username='CTXSYS';
------------------2.查看角色-----------------
select * from dba_roles WHERE ROLE = 'CTXAPP';
------------------3.解锁-----------------
ALTER USER CTXSYS ACCOUNT UNLOCK;
------------------4.给你的账号授权-----------------
GRANT CTXAPP TO szrkk1;
------------------5.创建文本解析器（这里我的这个字段是中文搜索，所以是这个解析器）-----------------
BEGIN
  ctx_ddl.create_preference ('my_lexer', 'chinese_vgram_lexer');
END;
------------------6.创建全文索引-----------------
CREATE INDEX  ind_dz ON yourtable(ADDRESS) indextype is ctxsys.context  parameters('lexer my_lexer');
------------------7.索引同步维护-----------------
BEGIN
    ctx_ddl.sync_index('ind_dz');
    ctx_ddl.optimize_index('ind_dz','full');
END;
------------------7.测试查询结果0.06s，就是这么快-----------------
select * from yourtable where contains(DZ,'中学')>0 AND ROWNUM <= 100;

大白菜炒鸡蛋

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Oracle单表千万数据量的模糊查询（地名地址查询）

首先说下需求: 项目要求对接公安的地名地址的数据库，难点有3个吧 1.公安的地名地址的数据库为Oracle的，我们项目用的是postgre 2.给我们的数据文件是dmp的文件，1200W的数据量就有8G,全量导入和增量更新都是个问题 3.文件导入后我们还需要在这1200W的数据中对某一个字段进行模糊查询下面进入正题： dmp导入oracle的过程我就不写在这里了，可以关注我的另外一篇帖子，今天这篇帖子只针对oracle， mysql的同理可得，都是针对索引进行优化，Oracl.
复制链接

扫一扫