深度学习
文章平均质量分 94
Williamtym
来自浙江,寻求志同道合的兄弟们一起加油努力啊!
展开
-
人工智能机器学习-飞桨神经网络与深度学习
机器学习(Machine Learning,ML)就是让计算机从数据中进行自动学习,得到某种知识(或者规律)。作为一门学科,机器学习通常指的是一类问题以及解决这类问题的方法,即如何从观测数据(样本)中寻找规律,并利用学习到的规律(模型)对未知或无法观测的数据进行预测。模型解读:介绍机器学习实践五要素(数据、模型、学习准则、优化算法、评估指标)的原理剖析和相应的代码实现,通过理论和代码的结合,加深机器学习的理解。原创 2023-09-23 14:58:11 · 3777 阅读 · 35 评论 -
开悟Optimization guide for intermediate tracks
参赛队伍可以研究英雄设计和机制玩法特点,完善特征、规则、动作空间、奖励等相关设计,提升环境状态表征能力,整合已知先验和,降低策略学习难度并提升单英雄能力上限。对于策略梯度方法,伴随着RL过程,value network学习目标的变化可能比较剧烈,影响了value估计的学习效果,进而影响了整体收敛效果与稳定性。样本池 当前框架版本的MemPool实现并非最优,可能存在一定程度的样本浪费现象 通过改进MemPool数据结构相关实现,改变随机读写方式,可以减少样本被覆盖的情况。原创 2023-08-24 16:37:36 · 3831 阅读 · 36 评论 -
DNQ算法原理(Deep Q Network)
Q-table中的每一行代表一个状态,每一列代表一个动作,表格中的每个元素Q(s,a)表示在状态s下采取动作a所能获得的最大收益的期望值。然后当没有达到目标状态,则执行一下几步,在当前状态s的所有可能行为中选取一个行为a,再利用选定的行为a,得到下一个状态s1,按照前面规定的计算方式来计算Q(s, a),再把s1赋值给我们的s,进行下一步迭代计算。表示在当前s∈S状态下,经过a∈A作用后,会转移到的其他状态的概率分布情况,在状态s下执行动作a,转移到s'的概率可以表示为p(s|s,a)原创 2023-08-23 16:12:36 · 5220 阅读 · 27 评论 -
人工智能学习框架—飞桨Paddle人工智能
机器学习的三要素:模型、学习策略、优化算法。原创 2023-08-16 18:32:35 · 3580 阅读 · 48 评论 -
深度学习,计算机视觉任务
BP网络的输入输出关系实质上是一种映射关系:一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。K(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。虽然这两个模型的损失函数值相同,模型A考虑的是局部,模型B考虑的是全局,它们两的侧重方向是不一样的,只是结果恰好相同而已。我们所看到的绿色线就是我们上一部分向前传播计算,红色的部分会把上一次的梯度携带到下一层的反向传播的计算中。原创 2023-08-06 15:57:16 · 3040 阅读 · 44 评论 -
深度学习,神经网络介绍
在隐藏层中的每一层神经元表示对x进行一次更新的数据,而每层有几个神经元(比如图中hidden1层中有四个神经元)表示将你的输入数据的特征扩展到几个(比如图中就是四个),就比如你的输入三个特征分别为年龄,体重,身高,而图中hidden1层中第一个神经元中经过变换可以变成这样‘年龄0.1+体重0.4+身高0.5’,而第二个神经元可以表示成‘年龄0.2+体重0.5+身高0.3’,每一层中的神经元都可以有不同的表示形式。激活函数是用来加入非线性因素的,提高神经网络对模型的表达能力,解决线性模型所不能解决的问题。原创 2023-07-31 18:44:05 · 3130 阅读 · 36 评论 -
深度学习,卷积神经网络
CNN(卷积神经网络)是一种常见的深度学习神经网络,主要用于图像识别、语音识别和其他图像或语音处理任务。CNN的基本结构包括卷积层(convolutional layer)、池化层(pooling layer)、全连接层(fully connected layer)和激活函数(activation function)。其中,卷积层用于提取图像或语音的特征,池化层用于降低数据的维度,全连接层用于将特征与标签进行映射,激活函数则用于增加非线性特性。原创 2023-07-28 11:20:03 · 6920 阅读 · 31 评论 -
通识强化学习,初步了解强化学习的运行规则和估值方法
强化学习的基本概念主要包括以下几个方面:状态(State):智能体在环境中的状态,是智能体所有属性的描述。行动(Action):智能体在环境中可以采取的行动,是智能体与环境交互的唯一途径。奖励(Reward):智能体在环境中采取行动后所获得的反馈,表示智能体的行动是否正确或成功。目标(Goal):智能体的最终目标,是智能体在环境中的期望结果。策略(Policy):智能体在环境中采取行动的方式和规则,是智能体的行为准则。原创 2023-07-15 10:46:56 · 5122 阅读 · 23 评论 -
开悟AIArena,深度学习神经网络,暑假开悟比赛的学习
峡谷漫步v1场景的目标是:通过算法训练一个智能体,让其在对地图不断的探索中学习移动策略,减少碰撞障碍物,以最少的步数从起点走到终点并且收集宝箱。本赛题支持的框架为:PyTorch是一个开源的机器学习框架。PyTorch是一个由Facebook开发的深度学习框架,它主要针对GPU加速的深度神经网络(DNN)编程,并且可以用于其他数学密集型应用2。PyTorch的特点:简洁:PyTorch的设计追求最少的封装,尽量避免重复造轮子。可以顺畅的在 eager 和 graph 模式下切换。原创 2023-07-11 11:07:24 · 13711 阅读 · 30 评论