机器学习
维生素_M
这个作者很懒,什么都没留下…
展开
-
聚类算法K-means
CONTENTSK-Means聚类原理聚类簇数 KKK 值的选择KKK 个聚类中心点的初始值选择距离度量方式损失函数的选择K-Means算法流程小结优点缺点K-Means聚类原理K-Means 聚类过程时,涉及四个关键点,即聚类簇数 KKK 值的选择、KKK 个聚类中心点的初始值选择、举例度量方式、损失函数的选择。聚类簇数 KKK 值的选择聚类簇数 KKK 值的选择是一个比较难处理的点,它...原创 2019-12-28 22:43:11 · 686 阅读 · 0 评论 -
决策树
CONTENTS特征选择熵信息增益信息增益比基尼系数决策树的生成CART决策树决策树的剪枝决策树是一种树状结构,可以进行基本的分类与回归,同时也是集成方法经常采用的基模型。总体来说,各种决策树主要涉及三要素,分别是特征选择、决策树的生成和决策树的剪枝。特征选择在建立决策树的过程中,每次特征选择时,是有一套标准的,下面就来介绍一下信息增益、信息增益比、基尼系数等。熵日常生活中,当我们要搞...原创 2019-12-22 20:17:16 · 222 阅读 · 0 评论 -
逻辑回归
CONTENTS1、逻辑回归概述2、逻辑回归原理2.1、逻辑回归模型2.2、 逻辑回归学习策略3、小结3.1、优点3.2、缺点1、逻辑回归概述简单来说,逻辑回归模型就是讲线性回归模型的结果输入一个sigmoid函数,将回归值映射到0 ~ 1,表示输出为类别 1 的概率。2、逻辑回归原理2.1、逻辑回归模型线性回归表达式如下:zi=w⋅xi+bz_i = \boldsymbol{w}\...原创 2019-12-15 20:40:53 · 278 阅读 · 0 评论 -
最优化方法:梯度下降
CONTENTS1、梯度下降1-1)引入1-2)梯度下降法原理1-3)梯度下降法的推导2、随机梯度下降2-1)随机梯度下降法过程通过定义损失函数并采用最小化损失函数策略,我们就能将目标问题转化为最优化问题。求解该问题的优化算法很多,最常用的就是梯度下降法。1、梯度下降1-1)引入计算机在运用迭代法做数值计算时,只要误差能够收敛,计算机经过一定次数的迭代后是可以给出一个真实解很接近的结果。...原创 2019-12-05 20:49:12 · 587 阅读 · 0 评论 -
线性回归算法
CONTENTS引入线性回归模型线性回归模型流程简单线性回归引入回归分析是一种预测性建模技术,主要用来研究因变量(yiy_iyi)和因变量(xix_ixi)之间的关系,通常被用于预测分析、时间序列等。回归分析,就是使用曲线或曲面来拟合某些已知的数据点,使数据点离曲线或曲面的举例差异达到最小。有了这样的回归曲线或曲面后,我们就可以对新的自变量进行预测,即每次输入一个自变量后,根据该回归曲线...原创 2019-12-01 16:42:15 · 169 阅读 · 0 评论 -
「特征工程」初探
CONTENTS1、数据清洗1.1)直接删除缺失数据1.2)固定值填充1.3)均值/中位数填充1.4)相邻值填充1.5)模型预测填充2、特征处理2.1)归一化2.2)标准化2.3)离散化2.4)one-hot编码1、数据清洗数据清洗主要是对原始给定的数据进行规整化,目的是得到一份适合机器学习模型处理的基本数据集。一般在实际业务场景下,得到的数据会存在缺失的情况。大部分机器机器学习模型不能自...原创 2019-11-24 20:17:44 · 176 阅读 · 0 评论 -
「如何评价模型的好坏」--- 小谈机器学习基础知识
这里写自定义目录标题欢迎使用Markdown编辑器数据拆分评价分类结果评价回归结果欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。数据拆分评价分类结果评价回归结果...原创 2019-11-17 14:24:34 · 561 阅读 · 1 评论 -
初探kNN
概述k近邻的思想就是:对于任意一个新的样本点,我们可以在这M个已知类别标签的样本点中选取K个与其距离最接近的点作为它的最近邻点,然后统计这个K个最近邻点的类别标签,采取多数投票表决的方式,即把这K个最近老点中绝大多数类别的点所对应的类别拿来当作要预测点的类别。k近邻分类原理k近邻模型主要有三个要素,即K值的选择、距离的度量方法、分类决策规则。K值的选择K值的选择会对k近邻法的结果产生较大...原创 2019-11-10 23:10:52 · 139 阅读 · 0 评论