机器学习
文章平均质量分 89
晓亮.
Every ending is a new beginning!
展开
-
【机器学习】算法改进——小批量和软更新
当构建好了强化学习的算法,我们还可以对算法进行一些改进,本文主要讲了两个改进。一个是小批量另一个是软更新。使用小批量,它可以加速强化学习算法,而且也适用于监督学习,加速监督学习算法;软更新,它可以帮助强化学习算法更好地收敛。原创 2022-09-02 14:24:38 · 2971 阅读 · 1 评论 -
【机器学习】强化学习算法的优化
我们通过之前的学习知道了所谓的强化学习,关键就是学习到Q函数,也就是状态动作函数,然后使用它来选择 好的行动。为了求得Q函数,我们-使用了深度学习和神经网络来训练模型学习Q函数。本文所讲的对于强化学习的优化,一是对改进神经网络框架;二是使用 ε-贪婪策略来改进算法。...原创 2022-08-28 20:23:16 · 3286 阅读 · 0 评论 -
【机器学习】什么是连续状态空间?如何构建一个强化学习的算法以及构建强化学习算法中的一些问题
以上就是今天要讲的内容,本文主要讲解了如何去构建一个强化学习算法以及构建算法中存在的问题及如何去解决。首先介绍了什么是连续状态空间,这是构建强化学习算法必须理解的,然后介绍了构建一个强化学习算法的框架,重点就是找到策略Pi。随后提到了学习状态值函数的完整算法。原创 2022-08-21 11:04:14 · 3324 阅读 · 0 评论 -
【机器学习】什么是随机马尔科夫决策过程?
马尔可夫决策过程是基于马尔可夫过程理论的随机动态系统的最优决策过程。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物,故又称马尔可夫型随机动态规划,属于运筹学中数学规划的一个分支。...原创 2022-08-18 14:54:01 · 729 阅读 · 0 评论 -
【机器学习】带你轻松理解什么是强化学习中的贝尔曼方程
我们得到的总回报,在强化学习问题中有两个部分,第一部分是我们马上得到的奖励,然后第二部分是gamma γ 乘以我们从下一个状态开始获得的回报 Q(s',a')。这两部分组合在一起,即得到总回报,这就是贝尔曼方程的本质。...原创 2022-08-17 19:40:20 · 3529 阅读 · 2 评论 -
【机器学习】带你轻松理解什么是强化学习中的状态动作函数 ?
强化学习中的状态动作函数Q(s,a)是一个非常重要的概念,再后面的贝尔曼方程中有所应用。本文主要来阐述一下什么是状态动作函数Q。原创 2022-08-16 20:21:51 · 1703 阅读 · 0 评论 -
【机器学习】强化学习的概念及马尔科夫决策
强化学习算法的关键思想不是告诉算法每个输入x 的正常输出y 是什么 ,而是给它指定一个奖励函数,告诉它上面时候做的好,上面时候做的不好。算法的工作是自动找出如何选择好的动作。强化学习的目标是给定一个马尔科夫决策过程,寻找最优策略,策略就是状态到动作的映射,使得最终的累计回报最大。...原创 2022-08-13 15:35:42 · 2016 阅读 · 0 评论 -
【机器学习】无监督学习中的基于内容过滤算法
基于内容过滤算法的使用比协同过滤算法使用的更频繁,多用于推荐系统中,基于内容过滤算法用到了神经网络,其中检索步骤和排名步骤两个步骤非常重要。检索物品组成列表,然后使用算法进行排名,最后再推荐给用户。...原创 2022-08-12 15:49:27 · 872 阅读 · 0 评论 -
【机器学习】使用tensorflow 实现协同过滤算法
本文主要讲解如何使用tensorflow 来实现协同过滤算法,以及如何使用均值归一化来优化协同过滤算法和寻找相关特征。原创 2022-08-11 15:49:30 · 1115 阅读 · 0 评论 -
【机器学习】无监督学习中的协同过滤算法(推荐系统)
在无监督学习中,协同过滤算法使用的还是很多的,比如我们常见的逛淘宝时,系统可以根据我们的浏览内容或者搜索词等给我们推荐商品、抖音每天推荐的短视频等。这些都是运用了无监督学习中的协同过滤算法。......原创 2022-08-08 16:44:20 · 1737 阅读 · 0 评论 -
【机器学习】无监督学习中的异常检测算法及其原理
本文主要讲解了一个比较常用的无监督学习算法 异常检测算法 。首先介绍了什么是异常检测;使用高斯分布去处理误差;然后讲解了异常检测的算法以及如何去评估我们建立的异常检测模型的好坏。后面将异常检测和监督学习进行对比,说明了何时使用监督学习何时使用异常检测。最后说了一下异常检测应该使用什么样的特征,以及如何去改变特征等。...原创 2022-08-03 09:49:33 · 7627 阅读 · 1 评论 -
【机器学习】聚类算法中的 K-means 算法及其原理
聚类( clustering )是一种典型的“无监督学习”,是把物理对象或抽象对象的集合分组为由彼此类似的对象组成的多个类的分析过程。K-means 算法是就是比较经典的聚类算法,使用较多,本文主要讲解了什么是K-means 算法,及其原理。......原创 2022-08-02 14:00:00 · 6460 阅读 · 0 评论 -
【机器学习】什么是决策树模型?如何去构建决策树?何时使用决策树?何时使用神经网络?
本文从决策树出发,第一部分讲解了什么是决策树模型,了解了一些决策树的基本概念;第二部分提到了如何确定在决策树节点使用什么特征,其中介绍了熵的概念、什么是信息增益,以及如何使用信息增益去构建决策树;第三部分讲到了独热编码,以及在决策树中的应用;第四部分讲了如何使用决策树解决回归问题;第五部分介绍了如何使用多个决策树,其中提到了有放回抽样、随机森林算法、xgboost算法;第六部分重点讲了什么时候去使用决策树,讲决策树与神经网络做了个比较。...原创 2022-07-24 11:02:55 · 7537 阅读 · 2 评论 -
【机器学习】什么是学习曲率?如何解决模型中方差和偏差问题?什么是迁移学习?什么是模型的精确率和召回率?
本文主要讲解了如何构建机器学习系统,首先说明了说明是学习速率,接着讲解了解决神经网络模型中的方差和偏差问题,简单说了机器学习开发的迭代循环,如何去进行误差分析等。重点阐述了什么是迁移学习和神经网络模型中精确率和召回率问题,以及机器学习项目的完整周期。...原创 2022-07-19 07:30:00 · 784 阅读 · 0 评论 -
【机器学习】如何去评价一个神经网络模型的好坏?什么是交叉验证数据集?偏差和高差对模型的影响?
本文主要讲了如何去评估一个模型的性能,可以使用交叉验证数据集的训练方法,通过偏差和方差对模型进行诊断等,通过这些,我们可以对模型进行选择。后面还讲到了正则化对偏差和方差的影响以及如何去制定一个用于性能评估的基准去评价模型性能。......原创 2022-07-18 19:42:40 · 4903 阅读 · 0 评论 -
【机器学习】神经网络的训练步骤有哪些?神经网络中最常见的激活函数有哪几种?什么是多分类问题?
进行梯度下降最重要的就是计算梯度更新公式中的导数,tensorflow中的fit()函数,实际上使用了。对于隐藏层中激活函数的选择,在神经网络中使用最多的还是ReLU激活函数,sigmiod函数使用的很少。右边是softmax回归的代价函数,在损失函数中,y只能取一个数,对于的损失函数也就是一个值的负对数。总的来讲,改进的代码修改了模型的输出层,对于softmax回归,将softmax激活改为了线性激活。第三步,使用算法,使用梯度下降最小化代价函数J,通过不断更新w,b,来找到合适的参数,......原创 2022-07-16 15:01:26 · 1303 阅读 · 0 评论 -
【机器学习】什么是神经网络?如何去搭建神经网络?神经网络的原理是什么?
本文主要讲了神经网络的一些基础知识,包括神经网络的原理是什么?以及如何去搭建一个简单的神经网络?相信看完这篇文章,你会对神经网络有所了解原创 2022-07-13 19:49:20 · 1225 阅读 · 0 评论 -
array()、range() 和 arange()函数的区别和用法
本文主要讲解了 array()、range() 和 arange() 这三个函数的区别和用法原创 2022-07-11 14:57:12 · 5067 阅读 · 0 评论 -
【机器学习】什么是正则化?如何在线性回归和逻辑回归中使用正则化
正则化可以处理过度拟合问题,在线性回归和逻辑回归中均有应用。正则化在线性回归和逻辑回归中也有相似之处,进行梯度下降时的公式都是相似的,只是定义不同。原创 2022-07-11 07:30:00 · 3883 阅读 · 1 评论 -
【机器学习】什么是过度拟合?如何解决过度拟合?
在模型拟合数据时,当特征值太少,不能够很好的拟合数据,我们称其为欠拟合或高偏差;当特征值过多时,虽然拟合的曲线经过了每个数据,代价值接近0,但是它的实用性不强,不能很好的泛化,称其为过拟合或高方差...原创 2022-07-10 17:31:43 · 6623 阅读 · 0 评论 -
【机器学习】Sklearn库中LogisiticRegression() 函数的参数注解
Sklearn库中LogisiticRegression() 函数的参数注解原创 2022-07-10 07:30:00 · 2658 阅读 · 0 评论 -
【机器学习】什么是逻辑回归中的代价函数?如何在逻辑回归中去实现梯度下降?
我们学习了线性回归中使用的平方误差代价函数并不适用于逻辑回归,为了实现逻辑回归中进行梯度下降,我们定义了一个单个训练示例的损失,还提出了逻辑回归损失函数的定义通过这种损失函数的选择,整体的代价函数是凸的,这样我们就可以使用梯度下降得到全局最小值,除此之外,逻辑损失函数还可以简化写法,这样会方便我们实现代码......原创 2022-07-09 15:00:00 · 1121 阅读 · 0 评论 -
【机器学习】逻辑回归模型及决策边界的理解
之前我们学习了线性回归,它可以预测一个数字,下面,我们将学习分类,其中我们的输出变量y 只能取一小部分可能值中的一个,而不是无限范围内的数字实时证明。线性回归并不是解决分类问题的好算法,为了解决分类问题,我们可以使用另一种算法—逻辑回归......原创 2022-07-09 10:04:18 · 1197 阅读 · 0 评论 -
【机器学习】什么是多项式回归模型?如何检查梯度下降是否收敛?学习速率如何选择?
当我们进行梯度下降时,怎么知道它是不是收敛,找到接近代价函数的全局最小值的参数其中一个关键就是学习速率的选择原创 2022-07-03 21:00:00 · 783 阅读 · 0 评论 -
【机器学习】什么是特征缩放?如何去实现特征缩放?
当我们的特征值的取值范围太大或者太小时,使用梯度下降来使得代价函数最小化会很慢,这时候我们一般都会进行特征缩放。原创 2022-07-03 10:26:37 · 1662 阅读 · 0 评论 -
【机器学习】多元特征线性回归与向量化
只有一个特征变量的线性模型叫做一元线性回归模型,含有多个特征变量的线性模型叫做多元特征线性回归模型,也叫做多元线性回归模型,而不是线性回归,线性回归指的是其它的东西。对于多元线性回归模型,我们在实现代码时,使用矢量化可以使我们的代码更短,也可以使其运行的速率更高,多元线性回归模型求代价函数的最小值有两个方法,一个是梯度下降算法,另一个方法叫正规方程,正规方程虽然可以找到多元线性回归模型代价函数的最小值,但是有不少缺点:不像梯度下降,正规方程不能推广到其他学习算法,运行的也很慢............原创 2022-07-02 07:30:00 · 1488 阅读 · 0 评论 -
【机器学习】梯度下降是什么?有什么作用?
学习了代价函数,下一步那我们就要了解如何去获取代价函数的较小值,当然我们可以手动获取等高线的图,然后自己一个一个的去试,最后找到合适的参数w,b的值,但是这不是我们想要的,我们需要一个有效的算法,它可以自己去查找合适的参数w,b的值,给我们最合适的模型,使得代价函数 j 最小化。这个有效的算法就是梯度下降 gradient descent 。梯度下降是机器学习最重要的算法之一。梯度下降的变化不仅用于训练线性回归,像在一些先进的神经网络模型中等在很多方面都有应用。......原创 2022-06-30 15:38:08 · 3535 阅读 · 0 评论 -
【机器学习】对于代价函数的理解及其 w,b 参数的求解
我们学习了f 和 j 的两者之间的关系,当我们改变w 或 改变 w 和b 时,我们最终会得到不同的直线,当这条直线穿过数据时,代价函数j 就会很小。线性回归的目标是找到参数w 或参数 w 和b ,从而使得代价函数j 取得最小可能值。...原创 2022-06-27 20:00:00 · 1798 阅读 · 1 评论 -
【机器学习】什么是代价函数?
前面我们学习了什么是线性回归,为了构建线性回归模型,最重要的一步就是构建代价函数,代价函数会告诉我们模型做的有多好,这样我们就可以试着 让它做的更好。代价函数是机器学习中最普遍和最重要的概念之一,它用于线性回归和训练世界上许多先进的Al模型...原创 2022-06-27 12:23:04 · 2830 阅读 · 0 评论 -
【机器学习】监督学习模型中的线性回归模型和分类模型
线性回归模型是一种特殊类型的监督学习模型。它被称为回归模型,因为它预测数字作为输出。任何预测数字的监督学习模型,在解决所谓的回归问题,称为回归模型,所以线性回归是回归模型的一个例子。......原创 2022-06-26 15:29:25 · 1849 阅读 · 0 评论 -
【机器学习】什么是非监督学习?
聚类算法,它是一种非监督学习算法,在没有标签的情况下获取数据,并尝试将他们自动分组到集群中。处理聚类算法,还有其他的非监督学习算法。在监督学习中,数据包含输入x和输出标签y,在非监督学习中,数据只包含输入x,但不输出标签y。算法必须在数据中找到一些结构或模式 或者有趣的东西。...原创 2022-06-20 07:30:00 · 2185 阅读 · 0 评论 -
【机器学习】什么是机器学习?什么是监督学习?
监督学习,映射输入x到输出y,学习算法从正确的答案中学习监督学习的两种主要的两种类型是回归regressio和分类classification,在回归应用的程序中,如预测房价,学习算法必须从无限多可能的输出数字中去预测数字,在分类算法中,学习算法必须对一个类别做出预测,所有数据中,一小部分可能的产出...原创 2022-06-19 21:56:00 · 579 阅读 · 0 评论