自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 TASK02-Linux的安装过程

1、相关工具准备虚拟机:Oracle VM VirtualBox Ubuntu版本:20.042、

2021-06-16 23:45:50 89

原创 TASK01:Linux简介

Linux现在已经是现代互联网体系中不可或缺的一部分了,可能你看不见它,但是它一直在你身边,各种嵌入式设备,如手表,机器人。还有广为人之的安卓。地球上大多数的服务器都是Linux操作系统。从航天到军事、从科研到金融、从手机到电脑,无处不在。...

2021-06-14 23:52:21 66

转载 2021-05-20

Task04:异常检测——基于相似度的方法基于相似度的异常检测,主要内容包括:基于距离的度量 基于密度的度量 文章转载来源:https://blog.csdn.net/chiyuhan89/article/details/1169747721、概述基于相似度的技术在数据点稀疏或与其他数据点相似度低时将其定义为异常值。在普通的数据处理中,我们常常需要保留正常数据,而对噪声和异常值的特性则基本忽略。但在异常检测中,我们弱化了“噪声”和“正常数据”之间的区别,专注于那些具有有价值特性的异常值。

2021-05-21 00:16:39 171

原创 2021-05-17

Task03:异常检测——线性相关方法一、回归模型 回归模型按照自变量个数分为一元回归和多元回归,按照影响是否先行分为先行回归和非线性回归模型。回归分析是广泛应用的统计分析方法,可用于分析自变量和因变量的影响关系(通过自变量来求因变量),也可以分析自变量对因变量的影响方向(正向影响、还是负向影响)。2.1 回归模型的优缺点(1)回归分析的优点是数据模式和结果便于理解,如线性回归用y=ax+b的形式表达,在解释和理解自变量与因变量的关系式性对容易;在基于函数公式的业务应用中,可...

2021-05-17 23:55:49 90

原创 2021-05-14

Datawhile_五月:异常检测(TASK02)异常检测-基于统计学的方法一、方法概述异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点,即利用统计学方法建立一个模型,然后考虑对象有多大可能符合该模型。常用的方法包括:高斯分布的方法、非参数方法、基于角度的方法、HBOS方法;检测方法特点:(1)异常检测的统计学方法由数据学习模型,以区别正常的数据对象和异常点。使用统计学方法的一个优点是,异常检测可以是统计上无可非议的

2021-05-15 01:30:38 314

转载 2021-05-11

在数据分析、挖掘过程中,经常会出现“异常数据”干扰我们的分析/预测结果,如何识别监测出异常数据?方法一:根据已有的业务经验识别出异常数据;方法二:采用技术手段识别出异常数据。前者,对业务素养要求高,缺点是业务经验不一定经得起数据验证;后者是我们在数据分析、挖掘过程中,基于一定的统计模型、算法识别出异常数据。本次参加DataWhale数据分析训练营的异常数据检测学习,有幸全面了解异常数据监测的方法有哪些、各种方法的有确定及原理有了一定的了解。

2021-05-11 23:42:09 161

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除