epoch、iteration、batch_size、episode概念理解

1. epoch

所有的训练数据都要跑一遍就是一个epoch。假设有10000个样本,这10000个样本都跑完就算一个epoch。实验中一般需要跑很多个epoch,取均值作为最后的结果,一般实验需要训练很多个epoch,取平均值作为最后的结果,从而减少偶然性,避免取到局部极值。

2. batch_size

批大小,如果把全部数据放入内存后再加载到显存中,空间显然不够的;如果一个一个数据加载训练并更新模型参数,效率极低。所以考虑一批一批地加载数据,每次送进去的数量就是batch_size,这样可以加快速度。假设把10000个样本,分成500批次送进去,则每次送进20个样本,batch_size=20。

3. iteration

一个epoch的数据=batch_size * iteration 。同样的例子假设把10000个样本,分成500批次送进去,则每次送进20个样本,则iteration=500,每经过一个iteration,参数更新一次。

4. episode

agent根据状态和策略做出行为,从而获得奖励,到任务结束。往往在agent训练完成后或经过一段时间训练后,进行很多次episode,检验agent执行任务的能力,可以通过评价指标、奖励值进行评估,对模型进行验证,并保存模型。(划分valid集就是典型的例子)

强化学习中用得多,以游戏举例,例如模型训练中途或迭代结束后,玩一轮游戏(例如玩一局飞机大战)看看本局游戏能得多少奖励。无论通关还是失败,都是一个episode。

参考文献:

【深度学习概念理解】epoch、iteration、batch_size、episode通俗理解 - 知乎

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: episodeepoch都是英语单词,episode的意思是“一段事件或经历”,通常用于描述电视剧、电影或小说中的某一段情节;而epoch的意思是“时代、纪元”,通常用于描述历史上的某一时期或某一重要事件的发生。 ### 回答2: Episodeepoch都是英语词汇,它们在不同的领域和语境中有着不同的含义。 在电视和电影领域中,Episode通常指的是一集电视剧或连续剧中的一个单独的剧情,通常情况下每一集都有不同的故事情节和发展。而在计算机游戏中,也有Episode这个概念,指的是游戏的每一关或每一部分。 而Epoch则通常用于描述一个时代或历史时间段。在天文学中,Epoch则表示地球轨道经过指定的点的时间点,用于计算星座和行星位置的变化。在计算机科学领域中,Epoch也表示计算机系统中的时间起点,用于计算和记录时间和日期。 尽管这两个词汇拥有不同的含义和用途,但它们有一个共同的概念,那就是分割和标记时间。不论是Episode还是Epoch,都是对时间的划分和标记,帮助我们更好地理解时间的流逝和变化。 总之,Episode指的是故事情节的划分,而Epoch则通常指的是时间段或时间起点的标记。这两个词汇在不同的领域和语境中,都有着不同但有用的含义。 ### 回答3: EpisodeEpoch都是英语中的单词,它们在不同的语境下有不同的意义。 首先,我们从Episode开始。Episode是指一段时间内发生的一系列相关事件或经历,通常与某个特定的人、地点或情境有关。例如,一个电视剧的每一集可以被称为一个Episode,因为它们构成了整个故事的一部分,但是每一集中的情节和角色行动都是不同的。另外,人们也可以使用Episode来形容某个人或者团体的一段特殊经历或者事件,比如说人们可能会问:"你在大学期间最难忘的Episode是什么?" 相比之下,Epoch是指较长时间的一段历史或者发展过程中特定的时期。这个词通常用来形容一段时间的开始或者结束,以及在这段时间内发生的一系列重要的变革或转折,比如说人类历史上的"古代"、"中世纪"或者"现代"时代就可以被称为Epoch。科学家也会使用这个词来形容特定领域的技术或者研究发展中的重要时期,比如说计算机科学中的"信息时代"和"人工智能时代"。 需要注意的是,虽然EpisodeEpoch都是英语中的单词,但是它们在不同的语境中具有不同的意义。因此,我们可以通过理解它们所处的具体语境来更好地理解它们的含义和使用方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值