CV/Tensor
生成模型
Sequence Learning
Deep Reinforcement Learning
在本次系列文 「英雄集結:深度學習的魔法使們」 中基本上每個脈絡皆有說明代表性的魔法陣。
先幫有看完這些系列文的你們大力鼓掌!在寫這篇的同時,iT邦幫忙鐵人賽輪播到的激勵語句是:
第一個青春,上帝給的:第二個青春,自己努力。寫鐵人文讓人好青春唷!
也幫自己鼓掌,每天擠時間寫鐵人文章,現在大概老了十歲...(說好的青春呢?)
隨著鐵人賽邁入尾聲,本篇將介紹最後一個魔法陣:Deep Q Network(DQN)。
2015 年 Deepmind 在 Nature 發表了「Human-level Control Through Deep Reinforcement learning」論⽂,內容使用強化學習(Reinforcement learning)和深度學習來教電腦玩 Atari 的遊戲。Deepmind 開啟了所謂的“深度強化學習”的時代,更多的應用大家想必都聽過,就是 AlphaGO,一樣是由 DeepMind 團隊所開發。
強化學習(Reinforcement learning)
在講 Deep Q Network(DQN)魔法陣之前,先簡單介紹強化學習:
強化學習是一種機器學習,允許創建一個 agent ,藉由與環境的互動來從中學習。就像我們學習如何騎自行車一樣,這種 AI 通