![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法模型
文章平均质量分 81
diggerTT
稳扎稳打,步步为营
展开
-
理工学---算法模型---传统机器学习---树相关---决策树
基于决策树的分类系列内容为自己学习数据挖掘的一个笔记 本部分内容来源《数据挖掘导论》4.3节一、决策树生成算法所谓决策树,就是一个类似于流程图的树形结构,树内部的每一个节点代表的是对一个属性的测试,树的分支代表该属性的每一个测试结果,而树的每一个叶子节点代表一个类别。树的最高层是就是根节点。下图即为一个决策树的示意描述,内部节点用矩形表示,叶子节点用椭圆表示。该决策树用于对一个顾客是否会在本商场购原创 2017-11-01 17:50:39 · 36479 阅读 · 5 评论 -
理工学---算法模型---聚类分析之DBSCAN密度聚类算法
来源 DBSCAN(Density-Based Spatial Clustering of Applications with Noise,基于密度的抗噪聚类方法)。和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。 1. 密度聚类原理 DBSCAN是一种基于密度的聚类算法,这类密度聚类算法一般假定类别可以通过样本分布的原创 2018-03-27 23:41:48 · 4534 阅读 · 1 评论 -
理工学---算法模型---传统机器学习---朴素贝叶斯
贝叶斯分类器是基于贝叶斯定理构建出来的分类器,是一个统计分类器。对分类方法进行比较的有关研究表明,简单贝叶斯分类器在分类性能上与决策树和神经网络都是可比拟的。在处理大规模数据时,贝叶斯分类器已经表现出较高的准确性和运算性能。 贝叶斯分类器的假设是:指定类别中,样本各特征之间相互独立,即某一特征不同取值的概率与其他特征的取值没有任何关系。我们的目标是计算P(H/X),式中X={x1,x2,…,xn}原创 2017-11-25 17:31:03 · 1667 阅读 · 1 评论 -
理工学---算法模型---传统机器学习---树相关---随机森林原理与算法实现
随机森林原理随机森林是建立在决策树基础上集成方法(决策树中,由于噪声等因素及高方差的影响,可能会产生一些错误的分支,在没有修剪树枝的时候更容易如此)。随机森林通过有放回的方式从原始样本中随机抽取部分样本产生新的样本集合,重复这样的操作产生多个样本集合,每个样本集合后续都会产生一棵决策树;在每棵决策树产生的过程中,在每个节点进行分支的时候都随机地抽取部分特征参与决策树的分支,然后递归分支,递归分支的过原创 2017-11-03 14:50:03 · 13538 阅读 · 5 评论 -
算法模型---回归模型
1、基本概念线性回归假设因变量与自变量之间存在线性关系,因变量可通过自变量线性叠加而得到,即因变量和自变量之间可用如下方式表示。 y=w0+w1x1+w2x2+...+wnxny=w_0+w_1x_1+w_2x_2+...+w_nx_n式中x1,...,xn{x_1,...,x_n}为自变量,w1,...,wn{w_1,...,w_n}为权重系数,w0w_0为偏置。 线性回归就是要解决如何利用样原创 2017-12-25 09:10:23 · 6370 阅读 · 1 评论 -
理工学---算法模型---时间序列模型
1、时间序列时间序列是时间间隔不变的情况下收集的不同时间点数据集合,这些集合被分析用来了解长期发展趋势及为了预测未来。 时间序列与常见的回归问题的不同点在于: 1、时间序列是跟时间有关的;而线性回归模型的假设:观察结果是独立的在这种情况下是不成立的。 2、随着上升或者下降的趋势,更多的时间序列出现季节性趋势的形式;常用的时间序列模型有AR模型、MA模型、ARMA模型和ARIMA模型等。2、时间原创 2018-01-16 09:04:58 · 82969 阅读 · 3 评论 -
理工学---算法模型---树相关---Boosting 相关知识
boosting 是一种将弱分类器转化为强分类器的方法统称。adaboost是其中的一种,采用了exponential loss function(其实就是用指数的权重),根据不同的loss function还可以有其他算法,比如L2Boosting, logitboost…Boosting 是一种将弱分离器组合起来形成强分类器的算法框架原创 2018-03-31 19:01:48 · 499 阅读 · 1 评论