自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 建立二叉决策树伪代码

1.对输入的训练集,如果集合为空,算法结束2.如果不能选择到一个合适的特征及其决策值,则建立叶子节点,算法结束3.根据选择到的特征及其决策值,建立内部节点4.依据选择到的特征及其决策值将输入的训练集划分为左、右两个子集,对每个子集递归调用本算法。第2步中,选择哪一个特征及其决策值来划分训练集对生成的树结构影响很大,对决策树的研究基本上集中于该问题。第3步:建立内部测试节点第4步:根据选定特征及其决策值将训练集划分为若干个子集,对每个子集执行递归算法,子集建立的节点是本级节点的子节.

2022-05-06 16:38:42 391 1

原创 回归:最小二乘法求解回归模型代码

import numpy as npimport matplotlib.pyplot as pltdef least_square(X,Y): ''' 最小二乘法 :param X:矩阵,样本特征矩阵 :param Y: 矩阵,标签向量 :return: 矩阵,回归系数 ''' W = (X * X.T).I * X * Y.T#教材公式 return Wtemperatures = [15,20,25,30,35,40]flow.

2022-05-05 16:29:49 1593

原创 DBSCAN聚类算法原理和伪代码

1.DBSCAN算法K-means聚类算法基于距离的聚类算法,其中的局限性在于,在凸集中进行聚类,但是在非凸集聚类效果不佳。如图:对于下图,进行聚类,传统的聚类算法效果不佳,使用DBSCAN则效果更佳。DBSCAN是基于密度的聚类算法,将样本点分为三类:核心点:样本点处的密度大于密度下限边界点:样本点处的密度小于密度下限,但样本点在某一核心点的邻域内噪声点:既不是核心点也不是样本点原理:DBSCAN聚类算法本质上就是通过寻找一系列的紧紧挨着的高密度核心点(core p

2022-05-04 13:53:55 5099

原创 K-means聚类算法代码

k-means算法代码实现

2022-05-02 21:36:58 4656 3

转载 时间序列异常检测综述

1.介绍时间序列异常检测可以运用的地方:工业设备异常检测、欺诈检测,日志监控目录1.介绍异常:一种与其他观测结果偏离甚大的观测结果,从而引起怀疑,属于其他的模式。通常可以将异常的含义分为两类:一类是不管不顾全部收集的数据:如调查本市的居民平均工资,应该将数据进行清洗,筛选掉首富的数据,让数据更能符合普通居民数据的分布。另一类是有用的数据:获取一类数据,如机器运转,大部分是正常状态的数据,当遇到异常数据就可以提高注意。在时间序列背景下的离群值检测技术的分类离群值..

2022-03-21 11:05:52 2669

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除