EE问题相关资料摘记
1.问题定义
一个赌徒,要去摇老虎机,走进赌场一看,一排老虎机,外表一模一样,但是每个老虎机吐钱的概率可不一样,他不知道每个老虎机吐钱的概率分布是什么,那么每次该选择哪个老虎机可以做到最大化收益呢?这就是多臂赌博机问题(Multi-armed bandit problem, K-armed bandit problem, MAB)。
这个经典问题一个核心的权衡问题:我们是应该 探索(explora...
原创
2020-02-02 18:25:34 ·
185 阅读 ·
0 评论