靠默契保证的私有制:Python 中的私有

      人类文明开化以来,私有制似乎是人类历史的主流在西方国家,“私有财产神圣不可侵犯” 是很多资本主义国家的立国原则之一。在我国,“私有财产不可侵犯” 也是写在宪法中的。在人类社会中,私有制表面由由法律保证,实质上是有法律背后的国家强制力保证。 继续阅读

发表在 编程开发 | 标签为 , | 留下评论

XGBoost + LR 就是加特征而已

      LR (逻辑回归) 算法因其简单有效,成为工业界最常用的算法之一。但 LR 算法是线性模型,不能捕捉到非线性信息,需要大量特征工程找到特征组合。为了发现有效的特征组合,Facebook 在 2014年介绍了通过 GBDT (Gradient Boost Decision Tree)+ LR 的方案 [1] (XGBoost 是 GBDT 的后续发展)。随后 Kaggle 竞赛实践证明此思路的有效性 [2][3]。
继续阅读

发表在 算法荟萃 | 标签为 , | 7条评论

取代人类工作?人工智能也创造工作

      人工智能的飞速发展导致工作岗位的减少,从而引发社会矛盾,是人们普遍的想法。但是另一方面,人工智能也创造了另外一些工作。这些新的工作职位都是做什么的呢?都有哪些渊源呢?近年来人工智能大火,人工智能、机器学习、深度学习和大数据等概念频频出现。这些概念和这些工作职位又有什么关系呢?
继续阅读

发表在 大局洞察 | 标签为 , , , | 留下评论

人工智能当前,棋牌游戏留给人类的堡垒不多了

      最近半年在写一个棋牌游戏的环境:RoomAI,目的是为方便自己和他人在棋牌游戏 AI 方面进行一些探索和研究。 继续阅读

发表在 大局洞察, 游戏人工智能, 算法荟萃 | 标签为 , , , | 一条评论

Akka 使用系列之四: Future

      这篇文章介绍 Akka 的同步机制,以及 Spark 和 Akka 的恩怨情仇。 继续阅读

发表在 编程开发 | 标签为 , , | 一条评论

为了 1% 情形,牺牲 99% 情形下的性能:蜗牛般的 Python 深拷贝

      最近使用 Python 一个项目,发现 Python 的深拷贝 copy.deepcopy 实在是太慢了。 继续阅读

发表在 编程开发 | 标签为 , | 3条评论

TensorFlow 中的候选采样

      在从事深度学习过程中, 如果我们想训练一个类别非常多的分类器 (比如一个拥有巨大词汇库的语言模型), 正常的训练过程将非常缓慢。 继续阅读

发表在 算法荟萃 | 一条评论

拖拽式机器学习的爱与恨

      拖拽式机器学习是我想了很久的问题。 继续阅读

发表在 大局洞察 | 标签为 | 一条评论

Akka 使用系列之三: 层次结构和容错机制

      这篇文章介绍 Akka 层次结构,以及基于层次结构的容错机制。 继续阅读

发表在 编程开发 | 标签为 | 留下评论

动态图计算:Tensorflow 第一次清晰地在设计理念上领先

      北京时间 2017 年 2 月 8 号,Google 宣布在其博客上发布 TensorFlow Fold 支持动态图计算。动态图计算是 Tensorflow 第一次清晰地在设计理念上领先。 继续阅读

发表在 算法荟萃, 编程开发 | 标签为 , | 留下评论

广告和推荐系统部署机器学习模型的两种架构

      广告和推荐系统是机器学习是最成熟的应用领域。那么广告和推荐系统是怎么在线上部署机器学习模型的呢? 继续阅读

发表在 算法荟萃, 编程开发 | 留下评论

Akka 使用系列之二: 测试

      通过上一篇文章,我们已经大致了解怎么使用 Akka,期待细致用法。这篇文章将介绍如何用 Akka-testkit 对 Akka 程序进行测试。 继续阅读

发表在 编程开发 | 标签为 , , , | 2条评论

Akka 使用系列之一: 快速入门

      最近在看 Spark 相关的资料,准备整理一个 Spark 系列。Akka 是 Spark 实现内部通讯的组件,Spark 启动过程的第一步便是建立 Akka 的 ActorSystem。因此看了有几篇文章学习了下 Akka 相关知识。 继续阅读

发表在 编程开发 | 标签为 , | 3条评论

不平衡数据的数据处理方法

      在机器学习中,不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡,那么分类器总是预测比例较大的类别,就能使得准确率达到很高的水平。比如正样本的比例为 1%,负样本的比例为 99%。这时候分类器不需要经过训练,直接预测所有样本为负样本,准确率能够达到 99%。经过训练的分类器反而可能没有办法达到99%。 继续阅读

发表在 算法荟萃 | 标签为 , | 一条评论

游戏智能系列之三:有限状态自动机

      游戏智能是很传统的领域,有限状态机和行为树是两种主要方法。 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 , | 一条评论

如果人工智能泡沫破灭了

      今天下午和朋友闲聊,聊到人工智能泡沫的问题。晚上写这篇博客,表达下自己对这个问题的见解。 继续阅读

发表在 大局洞察 | 标签为 , | 一条评论

在 Spark 中实现单例模式的技巧

      单例模式是一种常用的设计模式,但是在集群模式下的 Spark 中使用单例模式会引发一些错误。我们用下面代码作例子,解读在 Spark 中使用单例模式遇到的问题。 继续阅读

发表在 编程开发 | 标签为 , | 6条评论

游戏智能系列之二:再次进行准备

      上次准备用 AIsteroids 和 0.A.D 平台去学习游戏中的人工智能,现在换成 Clashjs。 继续阅读

发表在 游戏人工智能 | 标签为 , , | 留下评论

强化学习系列之九:Deep Q Network (DQN)

      我们终于来到了深度强化学习。 继续阅读

发表在 强化学习 | 标签为 | 3条评论

游戏智能系列之一:一些准备工作

      一直想开游戏人工智能的专题。只是最近刚刚用 Spark, 踩了一些坑,没有时间看东西,就延误了。虽然现在还没有看什么东西,但拖不了了,下定决心这个专题。 继续阅读

发表在 游戏人工智能, 算法荟萃 | 标签为 | 留下评论

Metropolis-Hastings 和 Gibbs sampling

      在科学研究中,如何生成服从某个概率分布的样本是一个重要的问题。 如果样本维度很低,只有一两维,我们可以用反切法、拒绝采样和重要性采样等方法。 但是对于高维样本,这些方法就不适用了。这时我们就要使用一些 “高档” 的算法,比如下面要介绍的 Metropolis-Hasting 算法和 Gibbs sampling 算法。 继续阅读

发表在 算法荟萃 | 标签为 , , | 留下评论

超快的 fastText

      Word2Vec 作者、脸书科学家 Mikolov 文本分类新作 fastText:方法简单,号称并不需要深度学习那样几小时或者几天的训练时间,在普通 CPU 上最快几十秒就可以训练模型,得到不错的结果。 继续阅读

发表在 算法荟萃 | 标签为 , | 2条评论

强化学习系列之六:策略梯度

      上一篇文章介绍价值函数近似,用模型拟合价值函数。这篇文章我们介绍梯度策略,用模型直接拟合策略。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 22条评论

强化学习系列之五:价值函数近似

      目前,我们已经介绍了一些强化学习的算法,但是我们无法在实际问题中运用这些算法。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 13条评论

强化学习系列之四:模型无关的策略学习

      模型无关的策略学习,是在不知道马尔科夫决策过程的情况下学习到最优策略。模型无关的策略学习主要有三种算法: MC Control, SARSA 和 Q learning。 继续阅读

发表在 强化学习, 算法荟萃 | 标签为 | 14条评论