分类目录归档:强化学习

多 Agent 强化学习综述

这是来自我们组同事谢思发同学的文章。谢思发同学硕士毕业于厦门大学,于 2016 … 继续阅读

发表在 强化学习, 数学基础, 算法荟萃 | 标签为 , | 留下评论

动手写一个 DQN 的棋牌 AI

      深度强化 … 继续阅读

发表在 强化学习, 游戏人工智能, 算法荟萃 | 标签为 , | 2条评论

强化学习系列之九:Deep Q Network (DQN)

      我们终于 … 继续阅读

发表在 强化学习 | 标签为 | 4条评论

强化学习系列之六:策略梯度

      上一篇文 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 25条评论

强化学习系列之五:价值函数近似

      目前,我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 16条评论

强化学习系列之四:模型无关的策略学习

      模型无关 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 16条评论

强化学习系列之三:模型无关的策略评价

      上一章我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 13条评论

强化学习系列之二:模型相关的强化学习

      上一章我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 17条评论

强化学习系列之一:马尔科夫决策过程

      机器学习 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 40条评论