- 博客(1)
- 收藏
- 关注
原创 强化学习基础——bandit
目录为选择而生为错误买单代价经典方法朴素Bandit算法ε-Greedy算法Thompson sampling算法Thompson sampling算法流程UCBUCB算法流程LinUCBContext Bandit-附加信息刻画决策过程Context Bandit如何学习LinUCB算法流程LinUCB代码LinUCB with Hyb...
2019-09-21 11:10:22 3323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人