机器学习基础
文章平均质量分 91
Potato_Shy
这个作者很懒,什么都没留下…
展开
-
优化器简介
1、SGD随机梯度下降。随机的意思是随机选取一个batch进行梯度更新1.1、更新过程学习率ϵk\epsilon_kϵk梯度估计g^=1m∇θ∑iL(f(x(i);θ),y)=1m∂L∂θ\begin{aligned}\hat{g}& = \frac{1}{m} \nabla_{\theta}\sum_iL(f(x^{(i)};\theta), y) \\&=\frac{1}{m}\frac{\partial{L}}{\partial{\theta}}\end{a原创 2021-09-06 00:46:09 · 176 阅读 · 0 评论 -
机器学习基础——隐马尔可夫模型
隐马尔可夫模型定义:隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。对该问题中的数据进行数学定义所有可能的状态集合QQQ,其中NNN为所有可能的状态数:Q={q1,q2,...,qN}Q = \{q_1,q_2,...,q_N\}Q={q1,q2,...,qN}所有可能的观测集合VVV,其中MMM为所有可能的观测数:V={v1,v2,...,vM}V = \{v_1,v_原创 2021-06-03 22:36:10 · 276 阅读 · 0 评论 -
sklearn学习-sklearn.prepprocess.StandardScaler
官方文档点此处源码点此处1 api介绍StandardScaler是通过去均值和缩放到方差单位来标准化特征(Standardize features by removing the mean and scaling to unit variance)其方法如下:z=x−μs\largez = \frac{x-\mu}{s}z=sx−μ其中μ\muμ为均值,s为方差...原创 2020-03-27 22:30:44 · 329 阅读 · 0 评论 -
机器学习基础-k近邻
本章内容主要基于机器学习实战概述k—近邻算法采用测量不同特征值之间的距离方法进行分类。优点精度高,对异常值不敏感,无数据输入假定缺点计算复杂度高、空间复杂度高适用数据范围数值型和标称型简单来说,就是根据给定的事实,判断样本集中各样本与给定事实的差距,来对样本进行分类。k-近邻算法分类器分类器可以满足的功能是:输入三类信息的数值,计算出该值与已...原创 2020-03-05 12:47:32 · 334 阅读 · 0 评论 -
机器学习基础-决策树&随机森林
利用特征生成子节点,进行判断实例属性1 ID3算法ID3算法是在每个节点处选取能获得最高信息增益的分支属性进行分裂,就是每一次找到最重要的属性进行分类在每个决策节点处划分分支、选取分支属性的目的,是将整个决策树的样本纯度提升,就是保证每个分支节点下下对应的分类都是唯一的。衡量样本集合纯度的指标是熵1.1 熵和信息增益熵和信息增益是生成节点的主要依据。1.1.1 熵熵在物理学...原创 2020-03-05 12:37:21 · 294 阅读 · 0 评论