- 博客(6)
- 收藏
- 关注
原创 机器学习-决策树原理与应用
机器学习-决策树决策树是一种基于规则的方法,它用一组嵌套的规则进行。在树的每个决策节点处,根据判断结果进入一个分支,反复执行这种操作直到到达叶子节点,得到预测结果。这些规则是通过训练得到的而不是人工制定的。1树形决策过程一般将决策树设计成二叉树。与树的叶子节点,非叶子节点相对应,决策树的的节点,分为两种类型。(1)决策节点在这些节电处,需要进行判断以决定进入哪个分支,如用一个特征和设定好的阈值进行比较。决策几点一定有两个子节点,它是非叶子节点。(2)叶子节点表示最终的决策结果,他们没有子节点。
2020-10-02 23:10:20 374
原创 TensorFlow滑动平均模型
在Tensorflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模型。在初始化ExponentialMovingAverage时,需要提供一个衰减率(decay)。这个衰减率将用于控制模型更新的速度。ExponentialMovingAverage对每一个变量会维护一个影子变量(shadow vaiable),这个影子变量的初始值就是相应变量的初始值,...
2019-12-20 17:43:15 170
原创 各类聚类算法优缺点汇总及python实现
聚类算法汇总一、方法名字1.基于质心的算法K均值算法K均值算法的优点:1)是解决聚类问题的一种经典算法,简单、快速2)对处理大数据集,该算法保持可伸缩性和高效性3)当簇接近高斯分布时,它的效果较好。K均值算法的缺点:1)在簇的平均值可被定义的情况下才能使用,可能不适用于某些应用;2) 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事...
2019-12-12 14:11:47 13573 4
原创 基于密度的聚类算法
基于密度的算法基于密度的算法的核心思想是根据样本点某一邻域内的邻居数定义样本空间的密度,这类算法可以找出空间中形状不规则的簇,并且不用指定簇的数量。算法的核心是计算每一点处的密度值,以及根据密度来定义簇。DBSCAN算法DBSCAN算法是一种基于密度的算法,可以有效的处理噪声,发现任意形状的簇。它将定义为样本点密集的区域,算法从一个种子样本开始,持续向密集的区域生长直至到达边界。 算法使...
2019-12-10 16:34:28 1286 2
原创 机器学习模型的保存与调用
机器学习模型的保存与调用 在机器学习中常常会用到将训练好的模型保存,以便与在使用时不用再次训练 数据,就可以直接使用训练好的模型。模型的保存以sklearn中随机森林回归为例#加载数据集from sklearn.datasets import load_breast_cancerimport pandas as pdfrom sklearn.ensemble im...
2019-12-09 19:18:39 5776 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人