![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
kwunkau
这个作者很懒,什么都没留下…
展开
-
K-Means聚类算法
目录一、聚类与分类1.1 什么是聚类1.2 聚类和分类的区别?1.3 性能度量二、K-Means算法1.1 K-Means原理1.2 K-Means定义1.3 样例1.4 K-Means优缺点三、K-Means与KNN区别四、代码实现一、聚类与分类1.1 什么是聚类聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集成为一个“簇”。通过这样的划分,每个簇可能对应于一些潜在的概念(...转载 2019-12-29 20:04:37 · 566 阅读 · 0 评论 -
决策树
目录一、前言二、决策树的构建三、代码实现一、前言决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy...原创 2019-12-22 23:25:01 · 262 阅读 · 0 评论 -
逻辑回归
目录一、前言二、什么是逻辑回归一、前言逻辑回归(Logistic Regression,LR)。在Kaggle竞赛的统计中,LR算法以63.5%的出产率,荣获各领域中“出场率最高的算法”这一殊荣。在实际场景中,逻辑回归同样应用广泛,大到国家各项经济政策的制定,小到计算广告CTR,都能看到LR算的身影。除了应用广泛外,LR的建模过程还体现了数据建模中很重要的思想:对问题划分层次,并利用非线性变...原创 2019-12-15 23:32:11 · 218 阅读 · 0 评论 -
线性回归(二)
目录一、梯度下降1.1一、梯度下降1.1原创 2019-12-08 23:14:54 · 111 阅读 · 0 评论 -
线性回归(一)
一、简单线性回归1.1 什么是简单线性回归所谓简单,是指只有一个样本特征,即只有一个自变量;所谓线性,是指方程是线性的;所谓回归,是指用方程来模拟变量之间是如何关联的;简单线性回归,其思想简单,实现容易(与其背后强大的数学性质相关)。同时也是许多强大的非线性模型(多项式回归、逻辑回归、SVM)的基础。并且其结果具有很好的可解释性。1.2 求解思路回归重要的任务就是拟合,找到最佳的拟合...原创 2019-12-01 22:29:58 · 255 阅读 · 0 评论 -
K最近邻(KNN)算法(二)
目录一. 数据归一化1.1 为什么要数据归一化1.2 数据归一化方法1.3 代码实现1.4 注意事项2. 待补充一. 数据归一化1.1 为什么要数据归一化通过KNN算法的实践中,样本的不同特征的单位不同,会在求距离时造成很大的影响。比如:在两个样本中肿瘤大小的分别为1cm和5cm,发现时间分别为100天和200天,那么在求距离时,时间差为100、大小差为4,那么其结果会被时间所主导,因为肿瘤...原创 2019-11-24 23:49:22 · 142 阅读 · 0 评论 -
机器学习基础知识
目录一、机器学习基本步骤二、训练模型一、机器学习基本步骤收集数据: 无论是来自excel, access, text files等文件的原始数据,这一步(收集过去的数据)是未来学习的基础。相关数据的种类、密度和数量越大,机器的学习前景就越好准备数据: 任何分析过程都依赖于所使用数据的质量。我们需要花时间来确定数据的质量,然后采取措施来解决缺失数据和异常值的处理等问题。探索性分析可能是研究数...原创 2019-11-17 23:21:50 · 233 阅读 · 0 评论 -
K最近邻(KNN)算法
目录1. 算法介绍2. 算法流程梳理kNN算法流程如下:3. 分类算法样例代码实现:1. 算法介绍KNN算法中文名称叫做K近邻算法,是众多机器学习算法里面最基础入门的算法。它是一个有监督的机器学习算法,既可以用来做分类任务也可以用来做回归任务。KNN算法的核心思想是未标记的样本的类别,由距离他最近的K个邻居投票来决定。2. 算法流程通过理解算法思想,可以将其简化为“找邻居+投票”。K近邻法...原创 2019-11-10 11:02:01 · 459 阅读 · 0 评论