学习笔记
yyyyyyyyXu
一条ict酸菜鱼
展开
-
Mastering Complex Controlin MOBA Games with DeepReinforcement Learning
简介腾讯AI Lab 王者荣耀 深度强化学习DRL 解决MOBA 1v1游戏使用元组(S,O,A,P,r,p,y) 表示无限过程有衰减的马尔科夫决策过程S状态空间 O观测空间 A动作空间P:SxA->S状态转移概率 r:SxA->R 奖励函数p0:S->R初始状态的分布 y衰减因子 随机策略pi被影射到(0,1]每个agent的目标都是最大化累积奖励E[∑t=0Tγtr(st,at)]E[∑ _{t=0}^T γ^tr(s_t, a_t)]E[t原创 2020-06-26 18:00:15 · 606 阅读 · 0 评论 -
学习笔记|视觉语言导航任务
视觉语言导航任务任务提出:CVPR2018,在Matterport3D simulator仿真环境中,从随机初始化位置到目标位置的最佳路径的轨迹搜索任务。任务描述:这是一个偏向落地型的研究方向:该任务要求智能体,在环境中,按照自然语言指令进行导航,移动,最终到达指定目的地,所以这是一个涉及到计算机视觉和自然语言处理的多模态任务。学科定位:目前,在这两个领域的多模态任务主要有image captioning,VQA,image Generation等。通过对这些视觉语言综合任务的分类和比较,原创 2020-06-24 16:10:20 · 1516 阅读 · 1 评论 -
学习笔记|PackedSequence
使用RNN模型建模时,使用PackSequence处理不同长度的输入数据,作为RNN输入。from torch.nn.utils.rnn import PackedSequence对同一个patch中的不同文本使用padding的方式进行文本长度对齐,同时为了保证模型训练的精度,需要告诉RNN相关padding的情况,使用pack_padded_sequence实现。import nump...原创 2020-04-15 18:40:31 · 2834 阅读 · 2 评论 -
学习笔记|PyTorch 基础代码
导入包 版本查询import torchimport torch.nn as nnimport torchvisionprint(torch.__version__)print(torch.version.cuda)print(torch.backends.cudnn.version())print(torch.cuda.get_device_name(0))可复现性在硬件设...转载 2020-04-01 21:05:20 · 312 阅读 · 0 评论