分类目录归档:算法荟萃

多 Agent 强化学习综述

这是来自我们组同事谢思发同学的文章。谢思发同学硕士毕业于厦门大学,于 2016 … 继续阅读

发表在 强化学习, 数学基础, 算法荟萃 | 标签为 , | 留下评论

从先进走向普遍的广告和推荐系统方法之一: 在线学习

      广告和推 … 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 , , , , | 2条评论

动手写一个 DQN 的棋牌 AI

      深度强化 … 继续阅读

发表在 强化学习, 游戏人工智能, 算法荟萃 | 标签为 , | 一条评论

工欲善其事必先利其器——游戏 AI 环境对比

      Deep … 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 , , , , , | 3条评论

自我对弈的 AlphaGo Zero

      Alph … 继续阅读

发表在 算法荟萃 | 标签为 , | 6条评论

XGBoost + LR 就是加特征而已

      LR ( … 继续阅读

发表在 算法荟萃 | 标签为 , | 7条评论

人工智能当前,棋牌游戏留给人类的堡垒不多了

      最近半年 … 继续阅读

发表在 大局洞察, 游戏人工智能, 算法荟萃 | 标签为 , , , | 一条评论

TensorFlow 中的候选采样

      在从事深 … 继续阅读

发表在 算法荟萃 | 一条评论

动态图计算:Tensorflow 第一次清晰地在设计理念上领先

      北京时间 … 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 , | 一条评论

广告和推荐系统部署机器学习模型的两种架构

      广告和推 … 继续阅读

发表在 算法荟萃, 编程开发 | 2条评论

不平衡数据的数据处理方法

      在机器学 … 继续阅读

发表在 算法荟萃 | 标签为 , | 一条评论

游戏智能系列之三:有限状态自动机

      游戏智能 … 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 , | 一条评论

游戏智能系列之二:再次进行准备

      上次准备 … 继续阅读

发表在 游戏人工智能 | 标签为 , , | 留下评论

强化学习系列之九:Deep Q Network (DQN)

      我们终于 … 继续阅读

发表在 强化学习 | 标签为 | 3条评论

游戏智能系列之一:一些准备工作

      一直想开 … 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 | 留下评论

Metropolis-Hastings 和 Gibbs sampling

      在科学研 … 继续阅读

发表在 算法荟萃 | 标签为 , , | 留下评论

超快的 fastText

      Word … 继续阅读

发表在 算法荟萃 | 标签为 , | 2条评论

强化学习系列之六:策略梯度

      上一篇文 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 24条评论

强化学习系列之五:价值函数近似

      目前,我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 16条评论

强化学习系列之四:模型无关的策略学习

      模型无关 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 16条评论

强化学习系列之三:模型无关的策略评价

      上一章我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 13条评论

强化学习系列之二:模型相关的强化学习

      上一章我 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 17条评论

强化学习系列之一:马尔科夫决策过程

      机器学习 … 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 39条评论

Javascript 侵入机器学习?

      大家可能 … 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 | 一条评论

AlphaGo 是如何把 CNN 接到搜索的?

      现在最热 … 继续阅读

发表在 算法荟萃 | 标签为 , | 一条评论