数据集构造
- isocset 判断数据集是否是一类数据集,是则返回1
- gendatoc 从两个数据矩阵生成一个一类数据集
- oc_set 如果一类出现问题则改变为正常的类
- target_class 从一类数据集中提取目标类
- gendatgrid 围绕2D数据集创建网格数据集
- gendatout 在超球面围绕目标数据创建离群数据
- gendatblockout 在目标类周围的框中创建离群数据
- gendatoutg 围绕目标数据创建正态分布的离群数据
- gendaouts 在目标数据周围的超球面数据PCA子空间中创建异常数据
- dd_crossval 创建交叉验证数据集
- dd_looxval 留一交叉验证数据集创建
- dd_label 将分类标签放在同一数据集中
数据预处理
- dd_proxm 替代proxm.m
- kwhiten 将数据重新缩放到内核空间中的单位方差
- gower 计算Gower相似度
- disim 数据集的一般变换
一类分类器
random_dd 随机分配标签的描述
stump_dd 第一个特征的阈值
gauss_dd 正态分布的数据描述
rob_gauss_dd 强制高斯分布
mcd_gauss_dd 最小协方差行列式高斯分布
mog_dd 高斯混合数据描述
mog_extend 扩展了高斯混合数据描述
parzen_dd Parzen 核密度数据描述
nparzen_dd 简单核密度数据描述
autoenc_dd 自动编码器神经网络数据描述
kcenter_dd k-center数据描述
kmeans_dd k-means数据描述
pca_dd 主成分数据描述
som_dd 自组织映射数据描述
mst_dd 最小生成树数据描述
nndd 最近邻居的数据描述
knndd K-最近邻数据描述
ball_dd L_p-ball数据描述
lpball_dd 扩展了L_p-ball数据描述
svdd 支持向量数据描述
incsvdd 增量支持向量数据描述
(incsvc 增量支持向量分类器)
ksvdd 一般内核矩阵上的 SVDD
lpdd 线性编程数据描述
mpm_dd minimax概率机数据描述
lofdd 局部异常分数数据描述
lofrangedd 范围内的局部异常值分数
locidd 局部相关积分数据描述
abof_dd 基于角度的离群值分数数据描述
dkcenter_dd 距离k-center数据描述
dnndd 距离最近邻居的数据描述
dknndd 距离K-最近邻数据描述
dlpdd 距离 - 线性规划数据描述
dlpsdd 距离-线性规划相似性描述
如果分类器是一类分类器,则isocc为true
AUC优化器
- rankboostc 秩提升算法
- auclpm AUC线性规划映射
分类器后处理/优化/结合
consistent_occ 使用一致性优化超参数
optim_auc 通过最大化AUC来优化超参数
dd_normc 规范化oc分类器输出
multic 构建一个来自OCC的多类分类器
ocmcc 一类和多类分类器序列
误差计算
dd_error 分类器的假阳性和阴性分数
dd_confmat 混淆矩阵
dd_kappa 科恩的卡帕系数
dd_f1 F1得分计算
dd_eer 等错误率
dd_roc 计算接收器 - 操作特性曲线
dd_prc 计算Precision-Recall曲线
ROC 曲线下的dd_auc错误
dd_avprec Precision-Recall曲线的平均精度
dd_auprc 精确回忆曲线下的区域
dd_youdenJ Youden J统计
dd_costc 成本曲线
dd_aucostc 成本曲线下的区域
dd_delta_aic 密度估算器的 AIC错误
dd_fp 计算给定假阴性分数的假阳性
simpleroc 基本ROC曲线计算
dd_setfn 设置假阴性率的阈值
roc2prc 将ROC转换为精确回忆曲线
roc2hit 将ROC转换为hitrate-false-alarmrate曲线
fp_given_fn 估计错误的pos.rate,给出假的否定。率
fn_given_fp 估计错误的否定,给出假的pos。率
绘图函数
plotroc 绘制ROC曲线或精确回忆曲线
plotcostc 绘制成本曲线
plotg 绘制函数值的2D网格
plotw 绘制分类器w的2D实值输出
askerplot 绘制FP和FN分数与阈值
plot_mst 绘制最小生成树
lociplot 绘制一个lociplot
支持函数
dd_version 当前版本的dd_tools,具有升级可能性
istarget 如果对象是目标,则istarget为true
find_target 给出数据集中目标和异常值objs的索引
getoclab 返回数字标签(+ 1 / -1)
dist2dens 将地图距离与后验概率分开
dd_threshold 给出样本的百分位数
randsph 在单位超球面上统一创建异常数据
makegriddat 用于构造网格数据的辅助函数
relabel 重新标记数据集
dd_kernel 一般内核定义
center 核空间中的核矩阵中心
gausspdf 多变量高斯概率函数
mahaldist Mahalanobis距离
sqeucldistm 欧几里德距离平方
mog_init 初始化高斯混合体
mog_P 高斯混合物的概率密度
mog_update 使用EM更新MoG
mogEMupdate EM程序,以优化高斯混合
mogEMextend 巧妙地扩展MoG并应用EM
mykmeans 自己实现了k-means聚类算法
getfeattype 找到名义和连续的特征
knn_optk 使用留一法优化k为knndd
volsphere 计算超球面的体积
scale_range 为数据集计算合理的比例范围
inc_setup 启动函数incsvdd
inc_add 将一个对象添加到incsvdd
inc_remove 从incsvdd中删除一个对象
inc_store 将从inc_add获取的结构存储到prtools映射
unrandomize incsvc的非随机化对象
plotroc_update plotroc的支持函数
roc_hull 凸包在ROC曲线上
lpball_dist 到中心的lp-距离
lpball_vol lpball的体积
lpdist 两个数据集之间的快速lp距离
nndist (平均值)最近邻距离
dd_message 带颜色打印
例子
dd_ex1 显示nndd和svdd的性能
dd_ex2 显示分类器列表的性能
dd_ex3 显示了svdd和ksvdd的使用
dd_ex4 使用consistent_occ优化超参数
dd_ex5 显示了来自dlpdd的lpdd构造
dd_ex6 显示了不同的高斯混合分类器
dd_ex7 显示了一类分类器的组合
dd_ex8 显示了操作点的交互式调整
dd_ex9 显示了dd_crossval的使用
dd_ex10 显示了增量SVDD的使用
dd_ex11 使用OCC构造多类分类器
dd_ex12 精确回忆曲线和ROC曲线
dd_ex13 核化AUCLPM
dd_ex14 显示了一个类和多个类的组合
dd_ex15 显示参数优化映射
dd_ex16 内核分类器上的交叉验证