自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 离群点的类型分为几类,其基本含义是什么?

离群点的类型分为几类,其基本含义是什么?分为全局离群点条件离群点和集体离群点。全局离群点:当一个数据对象明显偏离了数据,其中大部分的对象是该数据对象就是全局离群点。条件离群点:该数据对象显着偏离数据集中的其他对象是该数据对象,才被称为条件群群点。集体离群点:当数据集中的一些数据对象集体显著偏离整个数据集时,该数据对象集体形成的数据集即为集体离群点。...

2021-12-27 23:15:09 2325

原创 典型的OLAP有哪些?基本含义是什么?

典型的OLAP有哪些?基本含义是什么?切片:在给定的数据立方体的一个为单进行的选择操作。切片的目的是降低多维数据集的维度,使注意力集中在较少的维度上。切块:在给定的数据立方体的两个或多个维上进行的选择操作。切块的结果是得到一个子立方体。上卷:是在数据立方体中执行聚集操作,通过在维级别上升或者通过消除某个或某些维来观察更概括的数据下钻:通过在维级别中下降,或者通过引入某个或某些维更加细致的观察数据,他是上卷逆操作。旋转:改变数据立方体维次序的操作。...

2021-12-27 23:12:33 868

原创 数据预处理的主要方法有哪些?每个方法的主要内容是什么?

数据清理(Data Cleaninig):去掉数据中的噪声,纠正不一致。数据集成(Data Integration):将多个数据源合并成一致的数据存储,构成一个完整的数据集。数据转换(Data Transformation):将一种格式的数据转换为另一格式的数据(如规范化)。数据归约(Data Reduction):通过聚集、删除冗余属性或聚类等方法来压缩数据。...

2021-12-27 23:10:23 3275

原创 高质量的数据有哪些性质?

准确性(correctness):数据是否存在错误或异常。完整性(completeness):数据是否缺失。一致性(consistency):数据是否一致、是否兼容。时效性(Timeliness):数据是否及时更新。可信性(Believability):用户信赖的数据数量,数据越多、可信度越高可解释性(Interpretability):数据是否易于理解。...

2021-12-27 23:09:04 2296

原创 回归分析的步骤

回归分析步骤如下:1.确定变量,明确预测的具体目标,也就是确定因变量。2.建立预测模型,依据自变量和因变量的历史统计资料进行计算。3.进行相关分析,存在关系再进行相关分析。4.计算预测误差。5.确定预测值。利用回归预测模型,计算预测值对预测值进行综合分析,确定最后的预测值。...

2021-12-26 22:29:43 3877

原创 Apriori算法优缺点

Apriori算法优缺点1.优点适合稀疏数据集。算法原理简单,易实现。适合事务数据库的关联规则挖掘。2.缺点可能产生庞大的候选集。算法需多次遍历数据集,算法效率低,耗时。

2021-12-26 22:22:09 5515

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除