达梦数据库介绍及DM8全文索引应用经验分享

达梦介绍
武汉达梦数据库股份有限公司成立于2000年,为中国电子信息产业集团(CEC)旗下基础软件企业,专业从事数据库管理系统的研发、销售与服务,同时可为用户提供大数据平台架构咨询、数据技术方案规划、产品部署与实施等服务。多年来,达梦公司始终坚持原始创新、独立研发,目前已掌握数据管理与数据分析领域的核心前沿技术,拥有全部源代码,具有完全自主知识产权。达梦公司是国家规划布局内重点软件企业,同时也是获得国家“双软”认证和国家自主原创产品认证的高新技术企业,拥有国内数据库研发精英团队,多次与国际数据库巨头同台竞技并夺标。
达梦大学介绍
随着“大数据时代”的到来,互联网的作用已逐渐从简单的数据交流和信息传递上升到基于海量数据的分析。这是继云计算,物联网之后IT产业又一次颠覆性的技术变革,对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响,这将为数据库产业带来无限机会。

达梦公司本着“以人为本”的理念,成立达梦大学。达梦大学是达梦数据库管理系统及相关产品知识普及、产品培训服务、达梦公司与高等教育学院合作等全方位的教育体系模式,推动教育与创新,助力数据库产业链培养与储备人才的教育项目。

在跨越七个“五年计划”的发展过程中,达梦公司逐渐成长为国内数据库行业的领军企业,先后完成近60项国家级或省部级科研开发项目,取得50多项全球领先的研究成果,其中有30多项获国家级或省部级科技进步奖。

达梦公司建立了稳定有效的市场营销渠道和技术服务网络,可为用户提供定制产品和本地化原厂服务,充分满足用户的个性化需求。达梦公司产品已成功应用于金融、电力、航空、通信、电子政务等30多个行业领域。

DM8全文索引使用经验分享

1、构建测试用户和测试表

使用SYSDBA用户新建TEST用户,并赋予TEST用户创建表、创建全文索引的权限;
使用TEST用户创建测试表T_TEST。

create table t_test(id int primary key, name varchar(200), information text);
在这里插入图片描述

2、插入测试数据

使用如下命令插入测试数据:
insert into t_test(id, name, information)
values(1, ‘name1’,‘全文检索是对大数据文本进行索引,在建立的索引中对要查找的单词进行进行搜索,定位哪些文本数据包括要搜索的单词。因此,全文检索的全部工作就是建立索引和在索引中搜索定位,所有的工作都是围绕这两个来进行的。’);
insert into t_test(id, name, information)
values(2, ‘name2’, ‘rlwrap依赖readline包,在安装之前需先检查操作系统是否安装有readline包。本机测试环境中标麒麟6最小化安装,系统默认已安装好readline包(若系统无readline包,可配置yum源,使用yum安装readline)。使用如下命令检查readline环境.’);
insert into t_test(id, name, information)
values(3, ‘name3’, ‘武汉达梦数据库股份有限公司成立于2000年,为中国电子信息产业集团(CEC)旗下基础软件企业,专业从事数据库管理系统的研发、销售与服务,同时可为用户提供大数据平台架构咨询、数据技术方案规划、产品部署与实施等服务。多年来,达梦公司始终坚持原始创新、独立研发,目前已掌握数据管理与数据分析领域的核心前沿技术,拥有全部源代码,具有完全自主知识产权。达梦公司是国家规划布局内重点软件企业,同时也是获得国家“双软”认证和国家自主原创产品认证的高新技术企业,拥有国内数据库研发精英团队,多次与国际数据库巨头同台竞技并夺标。’);

3、创建全文索引

在创建全文索引时,用户可以为分词器定义分词参数,即控制分词器分词的数量,包括CHINESE_LEXER(中文最少分词)、CHINESE_VGRAM_LEXER(机械双字分词)、CHINESE_FP_LEXER(中文最多分词)、ENGLISH_LEXER(英文分词)、DEFAULT_LEXER(默认分词,为中文最少分词)。
DM全文检索的中文分词依赖系统词库,该词库是只读的,不允许修改。指定中文分词参数可以切分英文,但是指定英文分词参数不可以切分中文。

在创建全文索引时,也可以使用SYNC关键字指明全文索引的同步类型。不指定SYNC时创建全文索引后系统不进行全文索引填充(需要用户后期手工填充);指定为SYNC时系统将在全文索引建立后对全文索引执行一次完全填充;指定为SYNC TRANSACTION时系统将在每次事务提交后,自动以增量更新方式填充全文索引,不需要用户手动填充。

使用如下语句给T_TEST表创建全文索引,索引名称为CNT_TEXT。我们这里使用默认分词和SYNC TRANSACTION同步方式。
create context index cnt_text on t_test(information)
tablespace main sync transaction;
在这里插入图片描述

4、查询数据字典信息

查询SYSCONTEXTINDEXES系统表可以查询所有的全文索引信息:
在这里插入图片描述

查询SYSOBJECTS,增加where条件,可以看到创建全文索引后,系统会自动创建带有全文索引名称的系统表(CTI 开 头 ) 和 索 引 ( I D X 开头)和索引(IDX IDX开头)。
select name, id, schid, type

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值