博弈学习
(learning)
我们会看学习在重复博弈中的两种学习类型
目前这个话题量非常大
首先我们应该认识到在博弈论中的学习,与其他一些学科中的学习是相当不同的。比如 在机器学习,人工智能,计算机科学或者统计学优化中。
单个行动主体在环境中行动,环境对行动主体是未知的,它也可能是部分可观测的
那么就很难找出什么是最优策略,但对于最优策略有明确的定义。学习的目标是学习环境中的一些事物,如何在其中表现得最好。
在博弈论的情形下,我们的路径由其他所有参与者组成,即便你在努力学习和适应 他们也是。 最后发生的是,你无法区分学习与传授的概念,因为当你适应时,你在影响其他参与者的活动。
虚构博弈(fictitious play)