摘要: 麻将及其不同变体的规则复杂,构建高水平的麻将博弈AI (artificial intelligence)算法及其测试环境等面临巨大挑战。本文分析了麻将博弈的相关研究文献,梳理出基于知识和基于数据的两大类麻将AI构建方法,分析了每种类型的构建方法的优势和局限性,重点分析了Suphx构建方法。指出了麻将AI构建面临的问题和挑战;提出将经验回放、分层强化学习、好奇心模型、对手模型、元学习、迁移学习、课程学习等应用到麻将博弈AI算法优化中,构建多元化的麻将AI评估指标、通用对抗平台和高质量的数据集等未来的研究重点。
- 关键词:
- 机器博弈 /
- 非完备信息博弈 /
- 麻将 /
- Suphx /
- 知识 /
- 对手建模 /
- 深度学习 /
- 强化学习
机器博弈是人工智能研究领域的一个重要分支,根据游戏参与者对他人信息的可知程度,机器博弈分为完备信息和非完备信息博弈。复杂条件下的多智能体博弈[1-3]是当前研究的热点,对实践和生产具有重要意义,可以提高交通决策、优化智能生产、甚至对军事控制领域也有一定影响。麻将是典型的非完备信息博弈游戏,其隐藏信息复杂、随机性强、参与者多,是研究复杂条件下多智能体博弈的基础方向之一。麻将博弈AI(a