算法
文章平均质量分 90
甲壳剑齿鸟
蓝翔毕业数据挖掘汪
展开
-
K-Means算法
文章目录1. 介绍2. 流程3. 优点4. 缺点5. KNN vs K-Means6. 笔试题相关7. 参考资料 1. 介绍 K-Means算法是无监督的聚类方法,其思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽可能紧密的连在一起,而让簇间的距离尽量的大。 2. 流程 1)随机选择K个聚类的初始中心; 2)对任意一个样本点,求其到K个聚类中心的距离,将样本...原创 2019-10-15 14:32:14 · 473 阅读 · 0 评论 -
KNN(k-NearestNeighbor) K最近邻分类算法
文章目录1. 介绍2. 流程3. 优点4. 缺点5. K的取值6. 总结7. 笔试题相关8. 参考资料 1. 介绍 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。Cover和Hart在1968年提出了最初的邻近算法。KNN是一种分类(clas...原创 2019-10-13 15:08:11 · 1618 阅读 · 0 评论 -
梯度下降及优化算法
文章目录1. 梯度下降算法1.1 全量梯度下降(Batch gradient descent)1.2 随机梯度下降(Stochastic gradient descent) SGD1.3 小批量梯度下降(Mini-batch gradient descent)1.4 梯度下降算法存在的问题与挑战2. 梯度下降优化算法2.1 梯度下降速率优化2.1.1 SGDM2.1.2 NAG2.2 学习速率优化...原创 2019-10-12 09:36:34 · 607 阅读 · 0 评论 -
高级算法梳理 Task1 随机森林
1.任务内容: 集成学习的概念 个体学习器的概念 boosting bagging的概念、异同点 理解不同的结合策略(平均法,投票法,学习法) 随机森林的思想 随机森林的推广 随机森林的优缺点 随机森林在sklearn中的参数解释 随机森林的应用场景 ...原创 2019-08-07 21:10:51 · 169 阅读 · 0 评论 -
初级算法梳理 Task2 逻辑回归
【任务2 - 逻辑回归算法梳理】 1、逻辑回归与线性回归的联系与区别 2、 逻辑回归的原理 3、逻辑回归损失函数推导及优化 4、 正则化与模型评估指标 5、逻辑回归的优缺点 6、样本不均衡问题解决办法 7. sklearn参数 ...原创 2019-08-11 20:36:21 · 138 阅读 · 0 评论 -
初级算法梳理 Task3 决策树
信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 2.决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景 回归树原理 决策树防止过拟合手段 模型评估 sklearn参数详解,Python绘制决策树 ...原创 2019-08-11 20:40:10 · 145 阅读 · 0 评论