机器学习算法
文章平均质量分 94
言成苟文
这个作者很懒,什么都没留下…
展开
-
异常检测(三)---线性模型
三、线性模型1、引言真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的相关性分析。一类相关性分析试图通过其他变量预测单独的属性值,另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归,后者一个典型的例子是 主成分分析。本文将会用这两种典型的线性相关分析方法进行异常检测。需要明确的是,这里有两个重要的假设:假设一:近似线性相关假设。线性相关假设是使用两种模型进行异常检测的重要理论原创 2021-01-18 15:23:18 · 325 阅读 · 0 评论 -
异常检测(二)---基于统计学的方法
二、基于统计学的方法1、概述统计学方法对数据的正常性做出假定。它们假定正常的数据对象由一个统计模型产生,而不遵守该模型的数据是异常点。统计学方法的有效性高度依赖于对给定数据所做的统计模型假定是否成立。异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。即利用统计学方法建立一个模型,然后考虑对象有多大可能符合该模型。根据如何指定和学习模型,异常检测的统计学方法可以划分为两个主要类型:参数方法和非参数方法。参数方法 假定正常的数据原创 2021-01-15 21:34:08 · 701 阅读 · 0 评论 -
异常检测介绍
一、异常检测介绍1、什么是异常检测异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。识别如信用卡欺诈,工业生产异常,网络流里的异常(网络侵入)等问题,针对的是少数的事件。1.1 异常的类别**点异常:**指的是少数个体实例是异常的,大多数个体实例是正常的,例如正常人与病人的健康指标;**上下文异常:**又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是正常的,例如在特定时间下的温度突然上升或下降,在特定场景中的快速信用原创 2021-01-12 13:43:40 · 367 阅读 · 0 评论 -
windows系统下python快速注释多行
除了对每一行前面添加#的注释方式外(如若要注释多行,这种方式较慢),我们还可以考虑另外两种注释方式:1、Ctrl + / (先选中要注释的代码,再按Ctrl + /)2、用’’’ ‘’'或者""" “”"将要注释的代码置于多个单/双引号之间即可。...原创 2020-05-10 14:17:48 · 766 阅读 · 0 评论 -
机器学习---线性回归算法梳理
任务1 - 线性回归算法梳理1、机器学习的一些概念 有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证2、线性回归的原理3、线性回归损失函数、代价函数、目标函数4、优化方法(梯度下降法、牛顿法、拟牛顿法等)5、线性回归的评估指标6、sklearn参数详解...原创 2019-08-06 14:40:57 · 649 阅读 · 0 评论 -
机器学习---逻辑回归算法梳理
线性回归算法梳理任务2 - 逻辑回归算法梳理1、逻辑回归与线性回归的联系与区别2、 逻辑回归的原理3、逻辑回归损失函数推导及优化4、 正则化与模型评估指标5、逻辑回归的优缺点6、样本不均衡问题解决办法7. sklearn参数任务2 - 逻辑回归算法梳理1、逻辑回归与线性回归的联系与区别联系:逻辑回归属于对数线性模型,本质上是个线性模型。区别:逻辑回归得到一个离散的结果,但线性回归得到一个...原创 2019-08-09 10:28:32 · 359 阅读 · 0 评论 -
机器学习---决策树算法梳理
决策树算法梳理任务3 - 决策树算法梳理1、信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度)2.决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景3、回归树原理4、决策树防止过拟合手段5、模型评估6、sklearn参数详解,Python绘制决策树任务3 - 决策树算法梳理1、信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度)(1)熵: 表示随机变量不确定性...原创 2019-08-11 09:47:04 · 459 阅读 · 0 评论