算法理论 & 一些统计数学理论
文章平均质量分 71
Nicky_1218
一只总想着吃肉的死胖子。
安安静静的做着肥宅。
(保持一颗不断学习的心)
展开
-
数据管理的一些概念
整理的知识,备用。主题域: C模型是企业级模型,数据面向主题组织。主题域(Subject Area)模型是对业务模型的抽象,根据业务要求将数据模型管理员织成一些独立完整的领域,每个主题域对应某一领域所涉及的数据实体对象,并在较高层次上对该领域内数据实体进行完整一致的描述。C模型: C模型是企业级的业务数据模型,展现业务流程需要管理、使用和保存的业务信息。C模型是标准化、结构化、具有一定级别抽象的数据模型。C模型发布件: 包含基本词、类词,域清单、代码表值清单、唯一属性清单、实体属性映射关系、主题原创 2021-12-29 15:42:58 · 1586 阅读 · 0 评论 -
基于 划分方法 聚类- K均值 & K中心点(算法理论)
对n个观测的对象构建K个分区,每一个分区表示一个簇。然后基于距离计算,首先需要给定一个分区数K。特点: 适用于中小规模的球形数据簇。K - 均值(误差平方和)步骤: 1.在n个观测对象中随机选出K个观测对象,每一个观测对象代表一个簇。 2.计算剩余的每一个对象到这些簇之间的欧氏距离,分配到最相似的簇中,然后在计算均值。 3.使用计算出来的新的均值作为...原创 2019-04-29 20:43:40 · 2296 阅读 · 0 评论 -
模型评估的一些方法理论(算法理论)
MAIN:一、混淆矩阵混淆矩阵就是如下图所示的那样,也是最简单的一种模型验证方法:通过混淆矩阵可以算出模型预测精度((a+d)/(a+b+c+d))、正例覆盖率(b/(c+d))、负例覆盖率(a/(a+b))等。通过这么些指标综合考虑模型的预测准确率。二、ROC曲线在讲解ROC曲线之前,我们先看看几个定义:Sensitivity:正确预测到的正例数/实际正例总数,即b/(c+...原创 2019-04-29 20:45:39 · 1212 阅读 · 0 评论