2019年09月_Mr_哲

10月 09月 06月 05月 04月 03月 02月 01月

原创强化学习基础——bandit

目录为选择而生为错误买单代价经典方法朴素Bandit算法ε-Greedy算法Thompson sampling算法Thompson sampling算法流程UCBUCB算法流程LinUCBContext Bandit-附加信息刻画决策过程Context Bandit如何学习LinUCB算法流程LinUCB代码LinUCB with Hyb...

2019-09-21 11:10:22 3323

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 强化学习基础——bandit

空空如也

空空如也

原创强化学习基础——bandit