拖拽式机器学习的爱与恨

      拖拽式机器学习是我想了很久的问题。 继续阅读

发表在 大局洞察 | 标签为 | 留下评论

Akka 使用系列之三: 层次结构和容错机制

      这篇文章介绍 Akka 层次结构,以及基于层次结构的容错机制。 继续阅读

发表在 编程开发 | 标签为 | 留下评论

动态图计算:Tensorflow 第一次清晰地在设计理念上领先

      北京时间 2017 年 2 月 8 号,Google 宣布在其博客上发布 TensorFlow Fold 支持动态图计算。动态图计算是 Tensorflow 第一次清晰地在设计理念上领先。 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 , | 留下评论

广告和推荐系统部署机器学习模型的两种架构

      广告和推荐系统是机器学习是最成熟的应用领域。那么广告和推荐系统是怎么在线上部署机器学习模型的呢? 继续阅读

发表在 算法荟萃, 编程开发 | 留下评论

Akka 使用系列之二: 测试

      通过上一篇文章,我们已经大致了解怎么使用 Akka,期待细致用法。这篇文章将介绍如何用 Akka-testkit 对 Akka 程序进行测试。 继续阅读

发表在 编程开发 | 标签为 , , , | 2条评论

Akka 使用系列之一: 快速入门

      最近在看 Spark 相关的资料,准备整理一个 Spark 系列。Akka 是 Spark 实现内部通讯的组件,Spark 启动过程的第一步便是建立 Akka 的 ActorSystem。因此看了有几篇文章学习了下 Akka 相关知识。 继续阅读

发表在 编程开发 | 标签为 , | 2条评论

不平衡数据的数据处理方法

      在机器学习中,不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡,那么分类器总是预测比例较大的类别,就能使得准确率达到很高的水平。比如正样本的比例为 1%,负样本的比例为 99%。这时候分类器不需要经过训练,直接预测所有样本为负样本,准确率能够达到 99%。经过训练的分类器反而可能没有办法达到99%。 继续阅读

发表在 算法荟萃 | 标签为 , | 留下评论

游戏智能系列之三:有限状态自动机

      游戏智能是很传统的领域,有限状态机和行为树是两种主要方法。 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 , | 留下评论

如果人工智能泡沫破灭了

      今天下午和朋友闲聊,聊到人工智能泡沫的问题。晚上写这篇博客,表达下自己对这个问题的见解。 继续阅读

发表在 大局洞察 | 标签为 , | 留下评论

在 Spark 中实现单例模式的技巧

      单例模式是一种常用的设计模式,但是在集群模式下的 Spark 中使用单例模式会引发一些错误。我们用下面代码作例子,解读在 Spark 中使用单例模式遇到的问题。 继续阅读

发表在 编程开发 | 标签为 , | 4条评论

游戏智能系列之二:再次进行准备

      上次准备用 AIsteroids 和 0.A.D 平台去学习游戏中的人工智能,现在换成 Clashjs。 继续阅读

发表在 游戏人工智能 | 标签为 , , | 留下评论

强化学习系列之九:Deep Q Network (DQN)

      我们终于来到了深度强化学习。 继续阅读

发表在 强化学习 | 标签为 | 留下评论

游戏智能系列之一:一些准备工作

      一直想开游戏人工智能的专题。只是最近刚刚用 Spark, 踩了一些坑,没有时间看东西,就延误了。虽然现在还没有看什么东西,但拖不了了,下定决心这个专题。 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 | 留下评论

Metropolis-Hastings 和 Gibbs sampling

      在科学研究中,如何生成服从某个概率分布的样本是一个重要的问题。 如果样本维度很低,只有一两维,我们可以用反切法、拒绝采样和重要性采样等方法。 但是对于高维样本,这些方法就不适用了。这时我们就要使用一些 “高档” 的算法,比如下面要介绍的 Metropolis-Hasting 算法和 Gibbs sampling 算法。 继续阅读

发表在 算法荟萃 | 标签为 , , | 留下评论

超快的 fastText

      Word2Vec 作者、脸书科学家 Mikolov 文本分类新作 fastText:方法简单,号称并不需要深度学习那样几小时或者几天的训练时间,在普通 CPU 上最快几十秒就可以训练模型,得到不错的结果。 继续阅读

发表在 算法荟萃 | 标签为 , | 留下评论

强化学习系列之六:策略梯度

      上一篇文章介绍价值函数近似,用模型拟合价值函数。这篇文章我们介绍梯度策略,用模型直接拟合策略。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 16条评论

强化学习系列之五:价值函数近似

      目前,我们已经介绍了一些强化学习的算法,但是我们无法在实际问题中运用这些算法。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 10条评论

强化学习系列之四:模型无关的策略学习

      模型无关的策略学习,是在不知道马尔科夫决策过程的情况下学习到最优策略。模型无关的策略学习主要有三种算法: MC Control, SARSA 和 Q learning。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 9条评论

强化学习系列之三:模型无关的策略评价

      上一章我们介绍了模型相关 (Model-based) 的强化学习。从现在开始我们要介绍模型无关 (Model-free) 的强化学习。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 10条评论

强化学习系列之二:模型相关的强化学习

      上一章我们介绍了强化学习的基本假设——马尔科夫决策过程 (Markov Decision Process)。本文将介绍模型相关的强化学习算法。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 14条评论

强化学习系列之一:马尔科夫决策过程

      机器学习一共有三个分支,有监督学习、无监督学习和强化学习。强化学习是系统从环境学习以使得奖励最大的机器学习。强化学习和有监督学习的不同在于教师信号。强化学习的教师信号是动作的奖励,有监督学习的教师信号是正确的动作。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 36条评论

一个名字引发的血案: left-pad 和 npm 的那些事

      近日,一个只有 11 代码的 left-pad 被作者 unpublished。 npm 圈子因此闹得鸡犬不宁。究竟发生了什么呢? 继续阅读

发表在 编程开发 | 标签为 , | 留下评论

Javascript 侵入机器学习?

      大家可能都听说过 “亚特伍德定律” 这个笑话,大意是说任何能够由 JavaScript 所编写的内容最终都会由 JavaScript 进行编写。现在 Javascript 要侵入机器学习了嘛?一些工程师已经开始用 Javascript 编写机器学习的代码了。

继续阅读

发表在 算法荟萃, 编程开发 | 标签为 | 一条评论

AlphaGo 是如何把 CNN 接到搜索的?

      现在最热的话题莫过于李世石和 AlphaGo 的围棋大战。虽然我也想蹭下这个热点,但我不懂深度学习,不懂强化学习,更不懂围棋的。因此认真看 AlphaGo 的论文和田渊栋大牛的知乎文章,写一些简明笔记分享给大家。希望没有什么基础的童鞋也能看懂。 继续阅读

发表在 算法荟萃 | 标签为 , | 一条评论

深度学习框架大战正在进行,谁将夺取“深度学习工业标准”的荣耀?

      随着深度学习研究热潮的持续发酵,各种开源 深度学习框架 层出不穷,其中包括:Caffe、CNTK、MXNet、Neon、TensorFlow、Theano 和 Torch (著名开源深度学习框架 Keras 相当于是 TensorFlow 和 Theano 的简化接口,这里就不并列了)。 继续阅读

发表在 大局洞察 | 标签为 , | 3条评论