机器学习
文章平均质量分 61
从数学推导开始,力求通俗易懂
加油上学人
算法工程师。擅长算法优化,代码重构,微积分。加油打工人
展开
-
基于tensorflow2.x的多GPU并行训练
基于TensorFlow2.x的多GPU并行训练,给出了基本操作流程,基本内容解释,其中注意事项。原创 2023-04-20 15:38:11 · 2647 阅读 · 6 评论 -
长短时记忆网络LSTM
网络介绍长短时记忆网络(Long short time memory network, LSTM)是RNN的重要变体,解决了RNN无法长距离依赖的问题,同时缓了RNN的梯度爆炸问题。LSTM由遗忘门、输入门、重置门和输出门四部分组成,当中使用了tanhtanhtanh和sigmoidsigmoidsigmoid作为激活函数。模型概述使用记忆单元C~t{{\tilde{C}}_{t}}C~t解决长距离依赖和梯度爆炸的问题,使用CtC_tCt避免梯度消失的问题。在 LSTM中,将文本看成一个文本序列,原创 2022-04-29 16:12:29 · 674 阅读 · 0 评论 -
Q-learning时序差分强化学习算法
Q-learning是基于价值迭代的强化学习算法。在Q-learning中要定义策略的动作价值函数QQQ,以表示不同状态下不同动作的价值。记策略π\piπ的动作价值函数为Qπ(st,at)Q^{\pi}(s_t,a_t)Qπ(st,at),表示在状态sts_tst下,执行动作ata_tat带来的累积奖励GtG_tGt的期望值。计算流程如下:Qπ(st,at)Q^{\pi}(s_t,a_t)Qπ(st,at) = E[GT∣st,at]E[G_T|s_t,a_t]E[GT∣st,at]原创 2022-04-12 21:32:26 · 1036 阅读 · 0 评论 -
强化学习的概念及学习过程
强化学习的概念强化学习主要由智能体(agent)和环境(environment)两部分组成。智能体代表具有行为能力的物体,环境指智能体执行动作时所处的场景。其目标是寻找一个最优策略,使智能体在运动过程中获得的累积奖励最大。通俗的说:强化学习算法通过不断的与用户进行交互,先推送少量的类似信息给用户,看用户的反馈,然后根据用户的反馈再推送相关的内容,并在后序交互过程中继续根据用户的反馈不断维护和更新上述内容。学习过程强化学习可以用四元组<S,A,P,R>表示,其中S为状态集合、A为动作集原创 2022-04-12 21:12:36 · 2710 阅读 · 0 评论 -
RNN的网络结构和参数更新方式
1. RNN定义RNN是处理时序问题的重要工具。对于一个xxx,与一个UUU计算后得到一个hhh,这个hhh与VVV计算后得到输出ooo,hhh与WWW计算后的结果返回到hhh的输入,由此形成了一个循环,这就是循环神经网络;2. RNN参数更新方式假设一个输入序列xxx=x1,x2,...,xn{x_1,x_2,...,x_n}x1,x2,...,xn,网络展开后看作一个nnn层的前馈神经网络,第ttt层对应者时刻ttt的状态。记第ttt层的输入状态、隐藏状态和输出状态分别为xtx_txt,h原创 2022-04-11 23:43:30 · 1889 阅读 · 0 评论 -
熵、条件熵、信息增益通俗理解
熵:表示随机变量的不确定性。条件熵:在一个条件下,随机变量的不确定性。信息增益:熵 - 条件熵。好比张三李四王五三个人分别读了高中高中和大学,最后张三工资高,李四工资低,王五工资低,那么信息增益就是读书这个事。因为读书不确定工资高,但是在不读书的情况下也不能确定工资低。...原创 2022-03-13 23:29:57 · 378 阅读 · 0 评论 -
在统计模式识分类问题中,当先验概率未知时,可以
在贝叶斯决策中,对于先验概率p(y),分为已知和未知两种情况。p(y)已知,直接使用贝叶斯公式求后验概率即可;p(y)未知,可以使用聂曼-皮尔逊决策(N-P判决)来计算决策面。聂曼-皮尔逊决策(N-P判决)可以归结为找阈值a,即:如果p(x|w1)/p(x|w2)>a,则 x属于w1;如果p(x|w1)/p(x|w2)<a,则 x属于w 2;————————————————...转载 2022-03-13 23:27:06 · 318 阅读 · 0 评论 -
SVM的核函数
总结一下SVM的核函数。problem下列不是SVM核函数的是:A 多项式核函数B logistic核函数C 径向基核函数D Sigmoid核函数正确答案是:Banalysis支持向量机是建立在统计学习理论基础之上的新一代机器学习算法,支持向量机的优势主要体现在解决线性不可分问题,它通过引入核函数,巧妙地解决了在高维空间中的内积运算,从而很好地解决了非线性分类问题。构造出一个具有良好性能的SVM,核函数的选择是关键.核函数的选择包括两部分工作:一是核函数类型的选择,二是确定核函数类型后相转载 2022-03-13 23:09:58 · 4837 阅读 · 0 评论 -
支持向量机(SVM)处理非线性函数
定义:最小化:$$\1/2|||w|+\alpha\sum_{i=0}^\NXi原创 2020-01-12 20:25:42 · 364 阅读 · 0 评论 -
支持向量机(Support Vector Machine)之线性模型
线性模型,又分为线性可分(Liner Spearable)和线性不可分两类(None Liner Spearable)两种。作为初学,首先用二维介绍线性可分:比如这样子(这个图实在是太low,但能看懂)方框代表一类,假设为A类,圆圈代表另一类,假设为B类,中间的黄线将AB两类区分了开来。而支持向量机SVM的任务,就是确定中间唯一的那条中线L,使得L距离A/B类的距离最大并且L在最大间隔的中间。...原创 2020-01-11 11:26:08 · 372 阅读 · 0 评论 -
机器学习-推荐学习顺序
在开始学习机器学习时,从网上查了很多信息,得到的很多事推荐看周志华老师的《机器学习》,外号西瓜书,看吴恩达老师的视频课,无奈英语太弱,实在是抽象。在对比了很多课程和制定的学习计划如下:(一)支持向量机(二)神经网络2.1 感知器算法2.2多层神经网络2.3后向传播算法(三)迁移学习(四)增强学习(五)主成分分析(六)概率分类法(七)隐含马尔可夫参考书为周志华老师的《机器学习》...原创 2020-01-11 11:05:13 · 1378 阅读 · 0 评论