DM 数据库初始化工具

     dminit 是 DM 数据库初始化工具。在安装 DM 的过程中,用户可以选择是否创建初始数据库。如果当时没有创建,那么在安装完成之后,可以利用创建数据库工具 dminit 来创建。

系统管理员可以利用 dminit 工具提供的各种参数,设置数据库存放路径、段页大小、是否对大小写敏感等,创建出满足用户需要的数据库。该工具位于安装目录的 /bin 目录下。

   语法如下:

dminit KEYWORD=value

例如,初始化一个数据库,放在 /home/test/dmdbms 目录下,数据页 PAGE_SIZE 大小为 16 K。

./dminit PATH=/home/test/dmdbms PAGE_SIZE=16

dminit 使用较为灵活,参数较多。用户可使用“dminit HELP”快速查看各参数。

dminit HELP

格式: dminit                              KEYWORD=value

例如: dminit                              PATH=c:\dmdata PAGE_SIZE=16

关键字                                           说明(默认)

-----------------------------------------------------------------------------

INI_FILE                               初始化文件dm.ini存放的路径

PATH                                     初始数据库存放的路径

CTL_PATH                                   控制文件路径

LOG_PATH                                  日志文件路径

EXTENT_SIZE                             数据文件使用的簇大小(16),可选值:16、32、64,单位:页

PAGE_SIZE                                 数据页大小(8),可选值:4、8、16、32,单位:K

LOG_SIZE                             日志文件大小(256),单位为:M,范围为:64M ~ 2G

CASE_SENSITIVE                      大小敏感(Y),可选值:Y/N,1/0

CHARSET/UNICODE_FLAG            字符集(0),可选值:0[GB18030],1[UTF-8],2[EUC-KR]

SEC_PRIV_MODE                            权限管理模式(0),可选值:0[TRADITION],1[BMJ],2[EVAL]

LENGTH_IN_CHAR                          VARCHAR类型长度是否以字符为单位(N),可选值:Y/N,1/0

SYSDBA_PWD                                设置SYSDBA密码(SYSDBA),密码长度为9到48

SYSAUDITOR_PWD                         设置SYSAUDITOR密码(SYSAUDITOR),密码长度为9到48

DB_NAME                                         数据库名(DAMENG)

INSTANCE_NAME                            实例名(DMSERVER)

PORT_NUM                               监听端口号(5236)

BUFFER                                       系统缓存大小(100),单位M

TIME_ZONE                               设置时区(+08:00)

PAGE_CHECK                             页检查模式(0),可选值:0/1/2

EXTERNAL_CIPHER_NAME           设置默认加密算法

EXTERNAL_HASH_NAME                     设置默认HASH算法

EXTERNAL_CRYPTO_NAME         设置根密钥加密引擎

RLOG_ENC_FLAG                            设置日志文件是否加密(N),可选值:Y/N,1/0

USBKEY_PIN                              设置USBKEY PIN

PAGE_ENC_SLICE_SIZE                  设置页加密分片大小,可选值:0、512、4096,单位:Byte

ENCRYPT_NAME                      设置全库加密算法

BLANK_PAD_MODE                       设置空格填充模式(0),可选值:0/1

SYSTEM_MIRROR_PATH               SYSTEM数据文件镜像路径

MAIN_MIRROR_PATH                    MAIN数据文件镜像

ROLL_MIRROR_PATH                     回滚文件镜像路径

MAL_FLAG                                 初始化时设置dm.ini中的MAL_INI(0)

ARCH_FLAG                               初始化时设置dm.ini中的ARCH_INI(0)

MPP_FLAG                                 Mpp系统内的库初始化时设置dm.ini中的mpp_ini(0)

CONTROL                                          初始化配置文件(配置文件格式见系统管理员手册)

AUTO_OVERWRITE                        是否覆盖所有同名文件(0) 0:不覆盖 1:部分覆盖 2:完全覆盖

USE_NEW_HASH                      是否使用改进的字符类型HASH算法(1)

ELOG_PATH                               指定初始化过程中生成的日志文件所在路径

SYSSSO_PWD                                设置SYSSSO密码(SYSSSO),密码长度为9到48

SYSDBO_PWD                                  设置SYSDBO密码(SYSDBO),密码长度为9到48

PRIV_FLAG                                 设置权限标记,可选值:0、1

AP_PORT_NUM                              ECS模式下AP协同工作的监听端口

DFS_FLAG                                  初始化时设置dm.ini中的DFS_INI(0)

DFS_PATH                                   启用dfs时指定数据文件的缺省路径

DFS_HOST                                  指定连接分布式系统DFS的服务地址(localhost)

DFS_PORT                                  指定连接分布式系统DFS的服务端口号(3332)

DFS_COPY_NUM                     指定分布式系统的副本数(3)

DFS_DB_NAME                                指定分布式系统的中数据库名(默认与DB_NAME一致)

SHARE_FLAG                             指定分布式系统中该数据库的共享属性(0)

REGION_MODE                               指定分布式系统中该数据库的系统表空间数据文件的区块策略(0) 0:微区策略 1:宏区策略

HUGE_WITH_DELTA                       是否仅支持创建事务型HUGE表(1) 1:是 0:否

RLOG_GEN_FOR_HUGE                是否生成HUGE表REDO日志(0) 1:是 0:否

PSEG_MGR_FLAG                           是否仅使用管理段记录事务信息(0) 1:是 0:否

CHAR_TO_VARCHAR2                  是否允许变换定长字符类型为变长字符类型存储(Y),可选值:Y/N,1/0

HELP                                     打印帮助信息

1 INI_FILE

初始化文件 dm.ini 存放的路径,指定一个已经存在的 dm.ini 文件所在的绝对路径。作用是将现有 INI 文件,拷贝到新库,作为新库的 INI 文件直接使用。文件路径长度最大为 256 个字符。可选参数。

如果不指定该参数,那么 dminit 工具会直接生成一个新的 dm.ini 文件。如果指定了该参数但指定的 INI 文件不存在,那么 dminit 工具会报错无效的 INI 文件,同时生成一个新的 dm.ini 文件。

例如,指定现有 /home/test/dmdbms 库中 dm.ini,给新创建的 /home/dest/dmdbms 库使用。

./dminit INI_FILE=/home/test/dmdbms/DAMENG/dm.ini PATH=/home/dest/dmdbms

2 PATH

初始数据库存放的路径。默认路径为 dminit 当前所在的工作目录。文件路径长度最大为 256 个字符。可选参数。

3 CTL_PATH

初始数据库控制文件的路径,默认值 Windows 下为 PATH\DB_NAME\dm.ctl,Linux 下为/PATH/DM_NAME/dm.ctl(PATH 和 DB_NAME 表示各自设置的值)。文件路径长度最大为 256 个字符。可选参数。

4 LOG_PATH

初始数据库日志文件的路径。默认值 Windows 下为 PATH\DB_NAME\DB_NAME01.log 和 PATH\DB_NAME\DB_NAME02.log,Linux 下为 PATH/DB_NAME/DB_NAME01.log 和 PATH/DB_NAME/DB_NAME02.log(PATH 和 DB_NAME 表示各自设置的值)。文件路径长度最大为 256 个字符。日志文件路径个数不能超过 10 个。可选参数。

修改日志文件大小可以使用 LOG_SIZE 参数。

例如,创建一个数据库,包含两个日志文件 DATA01.log 和 DATA02.log。

./dminit PATH=/home/dest/dmdbms LOG_PATH=/home/dest/dmdbms/DATA01.log

LOG_PATH=/home/dest/dmdbms/DATA02.log

5 EXTENT_SIZE

数据文件使用的簇大小,即每次分配新的段空间时连续的页数。取值:16、32、64。单位:页数。缺省值 16。可选参数。

6 PAGE_SIZE

数据文件使用的页大小。取值:4、8、16、32,单位:K。默认值为 8。可选参数。

选择的页大小越大,则 DM 支持的元组长度也越大,但同时空间利用率可能下降。

7 LOG_SIZE

重做日志文件大小。取值:64~2048 之间的整数,单位 M。默认值为 256。可选参数。

每个 DM 数据库实例至少有两个重做日志文件,循环使用,LOG_SIZE 设置每个重做日志文件的大小。

修改日志文件路径可以使用 LOG_PATH 参数。

8 CASE_SENSITIVE

标识符大小写敏感。当大小写敏感时,小写的标识符应用""括起,否则被系统自动转换为大写;当大小写不敏感时,系统不会转换标识符的大小写,在标识符比较时也不能区分大小写。取值:Y、y、1 表示敏感;N、n、0 表示不敏感。默认值为 Y。可选参数。

9 CHARSET/UNICODE_FLAG

字符集选项。取值:0 代表 GB18030,1 代表 UTF-8,2 代表韩文字符集 EUC-KR。默认为 0。可选参数。

与此同时,CASE_SENSITIVE 为 N/n/0 和 CHARSET/UNICODE_FLAG 为 0 不能同时出现。

10 SEC_PRIV_MODE

权限管理模式。取值 0、1 和 2。0:TRADITION,表示传统模式;1:BMJ,表示专用机模式;2:EVAL,表示 EVAL 测评模式。默认为 0。可选参数。

11 LENGTH_IN_CHAR

VARCHAR 类型对象的长度是否以字符为单位。取值:1、Y 表示是,0、N 表示否。默认值为 0。可选参数。

1 或 Y:是,所有 VARCHAR 类型对象的长度以字符为单位。这种情况下,定义长度并非真正按照字符长度调整,而是将存储长度值按照理论字符长度进行放大。所以会出现实际可插入字符数超过定义长度的情况,这种情况也是允许的。同时,存储的字节长度 8188 上限仍然不变,也就是说,即使定义列长度为 8188 字符,其实际能插入的字符串占用总字节长度仍然不能超过 8188;

0 或 N:否,所有 VARCHAR 类型对象的长度以字节为单位。

12 SYSDBA_PWD

初始化时设置 SYSDBA 的密码,默认为 SYSDBA。密码长度为 9~48 个字符。可选参数。

13 SYSAUDITOR_PWD

初始化时设置 SYSAUDITOR 的密码,默认为 SYSAUDITOR。密码长度为 9~48 个字符。可选参数。

14 DB_NAME

初始化数据库名称,默认为 DAMENG。名称为字符串,长度不能超过 128 个字符。可选参数。WINDOWS 下文件名不能包含字符/ \ * : ? < > " | ,LINUX 下文件名不能包含字符/\ : < > " |。

15 INSTANCE_NAME

初始化数据库实例名称,默认为 DMSERVER。名称为字符串,长度不能超过 128 个字符。可选参数。

16 PORT_NUM

初始化时设置 dm.ini 中的监听端口号,默认 5236。服务器配置此参数,有效值范围(1024~65534),发起连接端的端口在 1024~65535 之间随机分配。可选参数。

17 BUFFER

系统缓存大小,以 M 为单位。推荐值:系统缓冲区大小为可用物理内存的 60%~80%。有效值范围(8~1048576),缺省值为 100。可选参数。

18 TIME_ZONE

初始化时区,默认为东八区(+08:00)。格式为[正负号]小时[:分钟],其中,正负号和分钟为可选项。时区设置范围为:-12:59~+14:00。可选参数。

19 PAGE_CHECK

是否启用页面内容校验模式。取值为:0:不启用;1:简单校验;2:严格校验(使用 CRC16 算法生成校验码)。默认 0。可选参数。

PAGE_CHECK 主要用来和数据库镜像一起使用。当 PAGE_CHECK 为 1 或 2 时,表示开启镜像系统,默认值 0 不开启。开启镜像后,用户还需要对指定的数据文件或回滚文件创建对应的镜像文件,涉及到的建库参数有 system_mirror_path、main_mirror_path 和 roll_mirror_path,下文会详细介绍。

镜像系统的运行流程:当系统需要把数据写入数据文件(或回滚文件)时,在写入以后如果数据文件(或回滚文件)创建了镜像文件,则需要把数据内容同时写入到镜像文件中。当系统需要从数据文件(或回滚文件)中读取数据时,如果数据文件(或回滚文件)中的校验信息与通过页内容生成的校验信息不一致则认为数据页已经损坏,那么系统会自动读取镜像文件中的数据继续提供服务。

20 EXTERNAL_CIPHER_NAME、EXTERNAL_HASH_NAME、EXTERNAL_CRYPTO_NAME

第三方加密时使用。缺省情况下,使用 DM 内部默认算法。

EXTERNAL_CIPHER_NAME:设置默认加密算法。备份、还原、建表等凡是用到加密算法,但是加密算法缺省的情况下,如果用户指定了第三方加密,则用此算法。密码为字符串,不能超过 32 个字符。可选参数。

EXTERNAL_HASH_NAME:设置默认 HASH 算法。用来生成加密数据的校验码。算法为字符串,不能超过 64 个字符。可选参数。

EXTERNAL_CRYPTO_NAME:设置服务器根密钥加密引擎。加密引擎提供 EXTERNAL_CIPHER_NAME 和 EXTERNAL_HASH_NAME 算法的动态库。加密引擎的使用,详细请参考《DM8 安全管理》一书加密引擎章节。密钥为字符串,不能超过 256 个字符。可选参数。

21 USBKEY_PIN

USBKEY PIN 是登录第三方设备 UKEY 的密码。供使用 UKEY 的用户使用。UKEY 用于服务器端存储加密根密钥的证书,缺省使用磁盘物理文件 dm_service.prikey 存储根密钥密钥的密文。

在 DM 的加密机制中,增加移动 UKEY 的使用,更能确保 SVR_KEY 的安全性,数据安全性也得到进一步提升。

USBKEY PIN 为字符串,不能超过 48 个字节。可选参数。

22 PAGE_ENC_SLICE_SIZE

使用数据页按扇区大小进行分片加解密时,指定数据页加解密的分片大小。可配置大小为 0、512 或 4096,单位为 byte,默认值为 4096。其中,0 表示不按分片进行加解密。可选参数。

当使用数据页分片加密即 PAGE_ENC_SLICE_SIZE 非 0 时,需要注意指定的加密算法是否支持数据页分片加密。DM 支持的加密算法中,没有“NOPAD”后缀的 ECB/CBC 加密算法不支持数据页分片加密。

23 ENCRYPT_NAME

指定全库加密算法,加密密钥由 DM 自动生成。不指定时,不进行全库加密。

全库加密操作流程:第一步,在创建数据库的过程中,通过参数 ENCRYPT_NAME 的设置,使用 DM 内部支持的加密算法或是第三方的加密算法对数据库文件进行加解密。第二步,在服务器启动及运行的过程中,需要对处理的所有数据页通过指定的加密算法和 DM 自动生成的密钥进行加解密处理,即如果数据页读入缓存,需要进行解密后才能使用,在缓存中的数据页进行刷盘时,需要对数据页进行加密后存储到数据文件中。

ENCRYPT_NAME:全库加密使用的算法名。算法可以是 DM 内部支持的加密算法,或者是第三方的加密算法,其中 DM 支持的加密算法可通过查询动态视图 V$CIPHERS 得到,相关介绍可参见《DM8 安全管理》7.1.1 节。算法名为字符串,不能超过 128 个字节。可选参数。

24 RLOG_ENC_FLAG

设置联机日志文件和归档日志文件是否加密。取值 Y/N,y/n,1/0,默认 N。可选参数。

如果使用第三方加密,则默认值算法为 external_cipher_name。否则使用 AES256_CFB。

25 BLANK_PAD_MODE

设置字符串比较时,结尾空格填充模式是否兼容 ORACLE。取值:1 兼容;0 不兼容。默认为 0。可选参数。

26 SYSTEM_MIRROR_PATH

指定 system.dbf 文件的镜像绝对路径。默认为空。可选参数。

当 PAGE_CHECK 为 1 或 2 时,才需要指定。

27 MAIN_MIRROR_PATH

指定 main.dbf 文件的镜像绝对路径。默认为空。可选参数。

当 PAGE_CHECK 为 1 或 2 时,才需要指定。

28 ROLL_MIRROR_PATH

指定 roll.dbf 文件的镜像绝对路径。默认为空。可选参数。

当 PAGE_CHECK 为 1 或 2 时,才需要指定。

29 MAL_FLAG

初始化时设置 dm.ini 中的 MAL_INI 值。取值 0 或 1。默认值为 0。可选参数。

1 表示 MAL_INI=1,启动 MAL 系统。同时,需要配置 dmmal.ini 文件。

0 表示 MAL_INI=0,不启用 MAL 系统。

30 ARCH_FLAG

初始化时设置 dm.ini 中的 ARCH_INI 值。取值 0 或 1。默认值为 0。可选参数。

1 表示 ARCH_INI=1,启用归档。同时,需要配置 dmarch.ini 文件。

0 表示 ARCH_INI=0,不启用归档。

31 MPP_FLAG

MPP 系统内的库初始化时设置 dm.ini 中的 MPP_INI。取值 0 或 1。默认值为 0。可选参数。

1 表示 MPP_INI=1,启用 MPP 系统。

0 表示 MPP_INI=0,不启用 MPP 系统。

32 CONTROL

指定初始化配置文件路径。可选参数。

CONTROL 参数只能单独使用,和其他参数一起使用会报错。

CONTROL 参数主要用于将数据文件创建在 ASM 或 DSC 环境中。CONTROL 参数和初始化配置文件,详细信息见下一章节。

33 AUTO_OVERWRITE

是否覆盖建库目录下所有同名文件。取值:0 不覆盖,表示建库目录下如果没有同名文件,直接创建。如果遇到同名文件时,屏幕提示是否需要覆盖,由用户手动输入是与否(y/n,1/0);1 部分覆盖,表示覆盖建库目录下所有同名文件;2 完全覆盖,表示先清理掉建库目录下所有文件再重新创建。默认值为 0。可选参数。

34 USE_NEW_HASH

是否使用改进的字符类型 HASH 算法。字符类型在计算 HASH 值时所采用的 HASH 算法类别。取值:0:原始 HASH 算法;1:改进的 HASH 算法。默认值为 1。可选参数。

如果备份文件和数据库文件中该参数值不一致,则还原时会报错。

35 SYSSSO_PWD

初始化时设置数据库安全员 SYSSSO 的密码,默认为 SYSSSO。密码为字符串,长度在 6 到 48 个字符之间。可选参数。

仅在安全版本下可见和可设置。

36 SYSDBO_PWD

初始化时设置数据库操作员 SYSDBO 的密码,默认为 SYSDBO。密码为字符串,长度在 6 到 48 个字符之间。可选参数。

仅在安全版本且 PRIV_FLAG=1 时,才有效。

37 PRIV_FLAG

是否是四权分立。取值:1 是,0 否。默认值为 0。可选参数。

为了保证数据库系统的安全性,DM 数据库采用“三权分立”或“四权分立”的安全机制,“三权分立”时系统内置三种系统管理员,包括数据库管理员、数据库安全员和数据库审计员,“四权分立”时新增了一类用户,称为数据库对象操作员。它们各司其职,互相制约,有效地避免了将所有权限集中于一人的风险,保证了系统的安全性。默认情况下为“三权分立”。

仅在安全版本下可见和可设置。

38 ELOG_PATH

指定初始化过程中生成的日志文件所在路径。可选参数。

39 DFS_FLAG

DMTDD 专用参数。指定该库是否使用 DFS 存储,1 是,0 否。缺省值为 0。可选参数。

40 DFS_PATH

DMTDD 专用参数。指定数据文件在 DFS 中的默认路径,要在路径最前加上 $。缺省为 $/db_name,db_name 是初始化库指定的。可选参数。

41 DFS_HOST

DMTDD 专用参数。指定连接分布式系统 DFS 的服务器地址。缺省为 localhost。可选参数。

42 DFS_PORT

DMTDD 专用参数。指定连接分布式系统 DFS 的服务端口号,有效值 1024~65534。缺省值为 3332。

43 DFS__NUM

DMTDD 专用参数。指定分布式系统的副本数。缺省为 3。

44 DFS_DB_NAME

DMTDD 专用参数。指定该库在 DMTDD 中的名字,默认是与 DB_NAME 一致。不同库不允许重名。可选参数。

45 SHARE_FLAG

DMTDD 专用参数。指定分布式系统中该数据库的共享属性,该库是否可用于配置多个 DS。取值为 0 或 1,0 表示该库只能配置到一个 DS 上;1 表示可以配置到多个 DS 上,且只能由 DSC 环境启动,默认为 0。可选参数。

46 REGION_MODE

DMTDD 专用参数。指定分布式系统中该数据库的系统表空间数据文件的区块策略。0:微区策略,1:宏区策略。缺省为 0。

47 HUGE_WITH_DELTA

是否仅允许创建事务型 HUGE 表。取值:1 是,0 否。默认值为 1。可选参数。

设置为 1 时,仅允许创建事务型 HUGE 表,不允许创建非事务型 HUGE 表。

48 RLOG_GEN_FOR_HUGE

是否生成 HUGE 表 REDO 日志。取值:1 是,0 否。默认值为 0。可选参数。

此参数仅在 HUGE_WITH_DELTA 为 1 时才允许设置,也就是仅限于对事务型 HUGE 表设置是否生成 REDO 日志。

49 PSEG_MGR_FLAG

是否仅使用管理段记录事务信息。取值:1 是,0 否。默认值为 0。可选参数。

配置为 0 时,除了在管理段中记录事务信息外,还会在事务分配的首个回滚页中记录事务信息;配置为 1 时,仅在管理段中记录事务信息。

支持将带有管理段的数据库降级到支持管理段之前的版本,配置为 0 和配置为 1 的降级策略有所不同,具体请咨询达梦技术服务人员。

50 CHAR_TO_VARCHAR2

用于指定是否允许把定长字符类型(CHAR)转换为变长字符类型(VARCHAR2)进行存储。取值:Y/y/1 是, N/n/0 否。默认值是 Y,可选参数。

51 HELP

显示帮助信息。可选参数。

达梦数据库 - 新一代大型通用关系型数据库 | 达梦在线服务平台

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据挖掘算法 算法目录 18大DM算法 包名 目录名 算法名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法 AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法 BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法 Classification DataMining_CART CART-分类回归树算法 Classification DataMining_ID3 ID3-决策树分类算法 Classification DataMining_KNN KNN-k最近邻算法工具类 Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯算法 Clustering DataMining_BIRCH BIRCH-层次聚类算法 Clustering DataMining_KMeans KMeans-K均值算法 GraphMining DataMining_GSpan GSpan-频繁子图挖掘算法 IntegratedMining DataMining_CBA CBA-基于关联规则的分类算法 LinkMining DataMining_HITS HITS-链接分析算法 LinkMining DataMining_PageRank PageRank-网页重要性/排名算法 RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简算法 SequentialPatterns DataMining_GSP GSP-序列模式分析算法 SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析算法 StatisticalLearning DataMining_EM EM-期望最大化算法 StatisticalLearning DataMining_SVM SVM-支持向量机算法 其他经典DM算法 包名 目录名 算法名 Others DataMining_ACO ACO-蚁群算法 Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络算法 Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类算法 Others DataMining_Chameleon Chameleon-两阶段合并聚类算法 Others DataMining_DBSCAN DBSCAN-基于密度的聚类算法 Others DataMining_GA GA-遗传算法 Others DataMining_GA_Maze GA_Maze-遗传算法在走迷宫游戏中的应用算法 Others DataMining_KDTree KDTree-k维空间关键数据检索算法工具类 Others DataMining_MSApriori MSApriori-基于多支持度的Apriori算法 Others DataMining_RandomForest RandomForest-随机森林算法 Others DataMining_TAN TAN-树型朴素贝叶斯算法 Others DataMining_Viterbi Viterbi-维特比算法 18大经典DM算法 18大数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够帮助大家学。 目前追加了其他的一些经典的DM算法,在others的包中涉及聚类,分类,图算法,搜索算等等,没有具体分类。 C4.5 C4.5算法与ID3算法一样,都是数学分类算法,C4.5算法是ID3算法的一个改进。ID3算法采用信息增益进行决策判断,而C4.5采用的是增益率。详细介绍链接 CART CART算法的全称是分类回归树算法,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成决策树后之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法,详细介绍链接 KNN K最近邻算法。给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。近的点的权重大点,远的点自然就小点。详细介绍链接 Naive Bayes 朴素贝叶斯算法。朴素贝叶斯算法是贝叶斯算法里面一种比较简单的分类算法,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导。详细介绍链接 SVM 支持向量机算法。支持向量机算法是一种对线性和非线性数据进行分类的方法,非线性数据进行分类的时候可以通过核函数转为线性的情况再处理。其中的一个关键的步骤是搜索最大边缘超平面。详细介绍链接 EM 期望最大化算法。期望最大化算法,可以拆分为2个算法,1个E-Step期望化步骤,和1个M-Step最大化步骤。他是一种算法框架,在每次计算结果之后,逼近统计模型参数的最大似然或最大后验估计。详细介绍链接 Apriori Apriori算法是关联规则挖掘算法,通过连接和剪枝运算挖掘出频繁项集,然后根据频繁项集得到关联规则,关联规则的导出需要满足最小置信度的要求。详细介绍链接 FP-Tree 频繁模式树算法。这个算法也有被称为FP-growth算法,这个算法克服了Apriori算法的产生过多侯选集的缺点,通过递归的产生频度模式树,然后对树进行挖掘,后面的过程与Apriori算法一致。详细介绍链接 PageRank 网页重要性/排名算法。PageRank算法最早产生于Google,核心思想是通过网页的入链数作为一个网页好快的判定标准,如果1个网页内部包含了多个指向外部的链接,则PR值将会被均分,PageRank算法也会遭到LinkSpan攻击。详细介绍链接 HITS HITS算法是另外一个链接算法,部分原理与PageRank算法是比较相似的,HITS算法引入了权威值和中心值的概念,HITS算法是受用户查询条件影响的,他一般用于小规模的数据链接分析,也更容易遭受到攻击。详细介绍链接 K-Means K-Means算法是聚类算法,k在在这里指的是分类的类型数,所以在开始设定的时候非常关键,算法的原理是首先假定k个分类点,然后根据欧式距离计算分类,然后去同分类的均值作为新的聚簇中心,循环操作直到收敛。详细介绍链接 BIRCH BIRCH算法利用构建CF聚类特征树作为算法的核心,通过树的形式,BIRCH算法扫描数据库,在内存中建立一棵初始的CF-树,可以看做数据的多层压缩。详细介绍链接 AdaBoost AdaBoost算法是一种提升算法,通过对数据的多次训练得到多个互补的分类器,然后组合多个分类器,构成一个更加准确的分类器。详细介绍链接 GSP GSP算法是序列模式挖掘算法。GSP算法也是Apriori类算法,在算法的过程中也会进行连接和剪枝操作,不过在剪枝判断的时候还加上了一些时间上的约束等条件。详细介绍链接 PreFixSpan PreFixSpan算法是另一个序列模式挖掘算法,在算法的过程中不会产生候选集,给定初始前缀模式,不断的通过后缀模式中的元素转到前缀模式中,而不断的递归挖掘下去。详细介绍链接 CBA 基于关联规则分类算法。CBA算法是一种集成挖掘算法,因为他是建立在关联规则挖掘算法之上的,在已有的关联规则理论前提下,做分类判断,只是在算法的开始时对数据做处理,变成类似于事务的形式。详细介绍链接 RoughSets 粗糙集算法。粗糙集理论是一个比较新颖的数据挖掘思想。这里使用的是用粗糙集进行属性约简的算法,通过上下近似集的判断删除无效的属性,进行规制的输出。详细介绍链接 GSpan gSpan算法属于图挖掘算法领域。,主要用于频繁子图的挖掘,相较于其他的图算法,子图挖掘算法是他们的一个前提或基础算法。gSpan算法用到了DFS编码,和Edge五元组,最右路径子图扩展等概念,算法比较的抽象和复杂。详细介绍链接 Others目录下的算法: GA 遗传算法。遗传算法运用了生物进化理论的知识来寻找问题最优解的算法,算法的遗传进化过程分选择,交叉和变异操作,其中选择操是非常关键的步骤,把更适应的基于组遗传给下一代。详细介绍链接 DbScan 基于空间密度聚类算法。dbScan作为一种特殊聚类算法,弥补了其他算法的一些不足,基于空间密,实现聚类效果,可以发现任意形状的聚簇。详细介绍链接 GA_Maze 遗传算法在走迷宫游戏中的应用。将走迷宫中的搜索出口路径的问题转化为遗传算法中的问题通过构造针对此特定问题的适值函数,基因移动方向的定位,巧的进行问题的求解。详细介绍链接 CABDDCC 基于连通图的分裂聚类算法。也是属于层次聚类算法主要分为2个阶段,第一阶段构造连通图。第二个阶段是分裂连通图,最终形成聚类结果。详细介绍链接 Chameleon 两阶段聚类算法。与CABDDCC算法相反,最后是通过对小簇集合的合并,形成最终的结果,在第一阶段主要是通过K近邻的思想形成小规模的连通图,第二阶段通过RI(相对互连性)和RC(相对近似性)来选一个最佳的簇进行合并。详细介绍链接 RandomForest 随机森林算法。算法思想是决策树+boosting.决策树采用的是CART分类回归数,通过组合各个决策树的弱分类器,构成一个最终的强分类器,在构造决策树的时候采取随机数量的样本数和随机的部分属性进行子决策树的构建,避免了过分拟合的现象发生。详细介绍链接 KDTree K-Dimension Tree。多维空间划分树,数据在多维空间进行划分与查找。主要用于关键信息的搜索,类似于在空间中的二分搜索,大大提高了搜索效率,在寻找目标元素时,使用了DFS深度优先的方式和回溯进行最近点的寻找。详细介绍链接 MS-Apriori 基于多支持度的Apriori算法。是Apriori算法的升级算法,弥补了原先Apriori算法的不足,还增加了支持度差别限制以及支持度计数统计方面的优化,无须再次重新扫描整个数据集,产生关联规则的时候可以根据子集的关系避免一些置信度的计算。详细介绍链接 ACO 蚁群算法。蚁群算法又称为蚂蚁算法。同GA遗传算法类似,也是运用了大自然规律的算法,用于在图中寻找最优路径的概率型算法。灵感来源于蚂蚁在寻找食物时会散播信息素的发现路径行为。详细介绍链接 BayesNetwork 贝叶斯网络算法。弥补了朴素贝叶斯算法中必须要事件独立性的缺点,利用了贝叶斯网络的DAG有向无环图,允许各个事件保留一定的依赖关系,网络结构中的每个节点代表一种属性,边代表相应的条件概率值,通过计算从而能得到精准的分类效果。详细介绍链接 TAN 树型朴素贝叶斯算法。此算法又被称为加强版朴素贝叶斯算法。在满足原有朴素贝叶斯条件的基础上,他允许部条件属性直接的关联性。形成树型的结构。详细介绍链接 Viterbi 维特比算法。给定一个隐马尔科夫模型以及一个观察序列,求出潜在的状态序列信息,每个潜在状态信息又会受到前一个状态信息的影响。 算法使用方法 在每个算法中给出了3大类型,主算法程序,调用程序,输入数据,调用方法如下: 将需要数据的测试数据转化成与给定的输入格式相同 然后以Client类的测试程序调用方式进行使用。 也可以自行修改算法程序,来适用于自己的使用场景
软件编程规范培训实例与练习 软件编程规范培训实例与练习  问题分类 1 逻辑类问题(A类)-指设计、编码中出现的计算正确性和一致性、程序逻辑控制等方面出现的问题,在系统中起关键作用,将导致软件死机、功能正常实现等严重问题; 接口类问题(B类)-指设计、编码中出现的函数和环境、其他函数、全局/局部变量或数据变量之间的数据/控制传输不匹配的问题,在系统中起重要作用,将导致模块间配合失效等严重问题; 维护类问题(C类)-指设计、编码中出现的对软件系统的维护方便程度造成影响的问题,在系统中不起关键作用,但对系统后期维护造成不便或导致维护费用上升; 可测试性问题(D类)-指设计、编码中因考虑不周而导致后期系统可测试性差的问题。  处罚办法 问题发生率: P=D/S D=DA+0.5DB+0.25DC 其中: P -问题发生率 D -1个季度内错误总数 DA -1个季度内A类错误总数 DB -1个季度内B类错误总数 DC -1个季度内C类错误总数 S -1个季度内收到问题报告单总数 1)当D≥3时,如果P≥3%,将进行警告处理,并予以公告; 2)当D≥5时,如果P≥5%,将进行罚款处理,并予以公告。 目 录 一、逻辑类代码问题 第5页 1、变量/指针在使用前就必须初始化 第5页 【案例1.1.1】 第5页 2、防止指针/数组操作越界 第5页 【案例1.2.1】 第5页 【案例1.2.2】 第6页 【案例1.2.3】 第7页 【案例1.2.4】 第8页 3、避免指针的非法引用 第9页 【案例1.3.1】 第9页 4、变量类型定义错误 第10页 【案例1.4.1】 第10页 5、正确使用逻辑与&&、屏蔽&操作符 第17页 【案例1.5.1】 第17页 6、注意数据类型的匹配 第18页 【案例1.6.1】 第18页 【案例1.6.2】 第18页 7、用于控制条件转移的表达式及取值范围是否书写正确 第20页 【案例1.7.1】 第20页 【案例1.7.2】 第21页 【案例1.7.3】 第22页 8、条件分支处理是否有遗漏 第24页 【案例1.8.1】 第24页 9、引用已释放的资源 第26页 【案例1.9.1】 第26页 10、分配资源是否已正确释放 第28页 【案例1.10.1】 第28页 【案例1.10.2】 第29页 【案例1.10.3】 第30页 【案例1.10.4】 第32页 【案例1.10.5】 第33页 【案例1.10.6】 第35页 【案例1.10.7】 第38页 11、防止资源的重复释放 第39页 【案例1.11.1】 第39页 12、公共资源的互斥性和竞用性 第40页 【案例1.12.1】 第40页 【案例1.12.2】 第40页 二、接口类代码问题 第43页 1、对函数参数进行有效性检查 第43页 【案例2.1.1】 第43页 【案例2.1.2】 第43页 【案例2.1.3】 第44页 【案例2.1.4】 第46页 【案例2.1.5】 第47页 【案例2.1.6】 第48页 2、注意多出口函数的处理 第49页 【案例2.2.1】 第49页 三、维护类代码问题 第51页 1、 统一枚举类型的使用 第51页 【案例3.1.1】 第51页 2、 注释量至少占代码总量的20% 第51页 【案例3.2.1】对XXX产品BAM某版本部分代码注释量的统计 第51页 四、产品兼容性问题 第52页 1、系统配置、命令方式 第52页 【案例4.1.1】 第52页 【案例4.1.2】 第53页 2、设备对接 第54页 【案例4.2.1】 第54页 3、其他 第55页 【案例4.3.1】 第55页 五、版本控制问题 第58页 1、新老代码中同一全局变量不一致 第58页 【案例5.1.1】 第58页 六、可测试性代码问题 第59页 1、调试信息/打印信息的正确性 第59页 【案例6.1.1】 第59页 一、逻辑类代码问题 1、变量/指针在使用前就必须初始化 【案例1.1.1】 C语言中最大的特色就是指针。指针的使用具有很强的技巧性和灵活性,但同时也带来了很大的危险性。在XXX的代码中有如下一端对指针的灵活使用: ... ... _UC *puc_card_config_tab; ... ... Get_Config_Table(
达梦数据库提供了一系列的可视化工具,包括DM数据库配置助手、DM管理工具DM服务查看器、DM控制台工具DM审计分析工具DM数据迁移工具DM性能监视工具。\[2\]这些工具可以帮助用户更方便地进行数据库管理和监控。DM数据库配置助手可以用于配置数据库的参数和选项,DM管理工具可以用于管理数据库的用户、角色和权限,DM服务查看器可以用于查看数据库的运行状态和性能指标,DM控制台工具可以用于执行SQL语句和管理数据库对象,DM审计分析工具可以用于分析数据库的审计日志,DM数据迁移工具可以用于将数据从其他数据库迁移到达梦数据库DM性能监视工具可以用于监视数据库的性能和优化查询。通过使用这些可视化工具,用户可以更加高效地管理和操作达梦数据库。 #### 引用[.reference_title] - *1* [达梦数据库可视化管理工具的配置](https://blog.csdn.net/novemborain/article/details/124630240)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [达梦数据库可视化工具的使用](https://blog.csdn.net/wxq1212/article/details/126964268)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值