UCT
white_gl
初入人工智能领域,希望从机器学习入手,寻求更好的博弈树搜索算法
展开
-
多臂强盗(multi-armed bandit)问题探究
转自:http://mlyixi.byethost32.com/blog/?p=15504Oct 2014多臂赌博机系列(1)by mlyixi ⋅ Leave a Comment假想一个风投他想着他的收益最大化,这时他总会面临一个两难: 何时去投资那些已经成功的公司,何时去投资那些还没有成功但具有很大潜力的公转载 2017-03-22 16:35:31 · 10128 阅读 · 0 评论 -
多臂强盗(multi-armed bandit)问题探究-续
转自 http://mlyixi.byethost32.com/blog/?cat=3510Dec 2014多臂赌博机系列(2)by mlyixi ⋅ Leave a Comment这一节我们来了解下多臂赌博机问题的提出和理论基础,最后讨论下UCB系列策略.当然,这里的多臂赌博机问题是随机式的. 随机式多臂赌博转载 2017-03-22 16:49:15 · 2548 阅读 · 1 评论 -
多臂强盗(multi-armed bandit)问题探究-续2
转自 http://mlyixi.byethost32.com/blog/?p=74710Dec 2014多臂赌博机系列(3)by mlyixi ⋅ Leave a Comment在上两节我们讨论的UCB系列算法面对的情况是静态的,即各臂的分布参数不会改变,于是我们就"乐观地面对不确定性"--根据采样平均值尽快转载 2017-03-22 16:51:25 · 2003 阅读 · 0 评论