Google 收购的是一群 geek 凑出来的全明星战队

漂亮的石头 · 2015-05-25

Google 2014 年收购的人工智能公司 DeepMind 在业界有怎样的实力和地位？

SZZhang，in probability we trust

上点干货以区别科普媒体的介绍：

DeepMind 从公司性质上来说与其他众多基于 machine learning (ML) 的 startup 有本质上的不同：

DeepMind 实际上是一家小型研究院，目前他们的主要任务是发论文。

它的组织结构类似于缩小版的微软研究院/Google Research，它不注重于将技术产品化，而纯粹将自己的方向放在 ML 的科学研究上（也就他们会在自己的主页上放一个大 link 上书“Publication”，点进去都是 ICML，NIPS 的论文），个人更倾向于把 DeepMind 当作 Google Research 在 London 的一个特殊分部。

从总体研究方向上来说，目前他们搞的东西就一个：神经网络（又名深度学习）。

拿他们最近的三个工作为例：

1. HUMAN LEVEL CONTROL THROUGH DEEP REINFORCEMENT LEARNING

2. NEURAL TURING MACHINES

3. DRAW: A RECURRENT NEURAL NETWORK FOR IMAGE GENERATION

对于 1，也就是“一款具有高级人工智能的游戏”，它实际上是 Reinforcement Learning + Neural Network, 基本框架依旧是 Q-Learning，有趣的地方在于，input 是直接的游戏屏幕画面，也就是 pixel-level，这一部分使用 CNN 来处理，而改进的 Q－Learning 使用了 replay memory [1] （93 年的 idea）。原论文是 Nature 上的要付费，技术细节戳这里：https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

对于 2. 这个工作很有意思，故名思义就是图灵机的神经网络版本，一个创新点在于使用了 memory （当然本质上的创新就不用说了）, 而不是单纯的将 model 的信息都存在 weight 里，相关的工作还包括 Facebook 的 Memory Network ［2］和 NYU Fergus （当然也是 Facebook Research 了）的［3］。

对于 3. 这个工作非常炫酷，结合了 variational autoencoder[4] (引用以 Max Welling 的工作为例，DeepMind 的就不引了) 和和 RNN，这篇论文是我见过的所有 generative model 在 CIFAR10 和 MNIST 上迄今为止的最棒的结果。他们有一个 youtube 的 demo 墙外的童鞋可以感受一下：https://www.youtube.com/watch?v=Zt-7MI9eKEo

从人员构成上来说，这家公司大概几十个人（？至少一年前是这样的），当初被 google 以 400M 收购，算一下平均一个人值不少钱，其中偏计算机的大部分都是 Deep Learning 系的，很多都是原来 Hinton, Lecun, Bengio, Schmidhuber，Welling 的学生。又因为地处 london，跟 UCL 有不少渊源，里面有一些 UCL 出来的搞 Neuroscience 的，需要提一下的是 Hinton 原来在 UCL 当过教授。

几个扛把子的（创始人就不用说了）：Alex Graves （深入搞过 RNN 应该都久闻其名), Karol Gregor (搞理论物理的)，Ilya Sutskever（2012NIPS 那篇影响深远的 CNN 论文的二作 [5]）。

综上，这是一群 geek 凑出来的 deep learning 全明星战队。

Reference:

[1] Long-Ji Lin. Reinforcement learning for robots using neural networks. Technical report, DTIC Document, 1993.

[2] Weston, Jason, Sumit Chopra, and Antoine Bordes. "Memory networks." arXiv preprint arXiv:1410.3916 (2014).

[3] http://arxiv.org/abs/1503.08895 (刚上线没多久的 paper 没找到 google cite，直接上链接)

[4] Kingma, Diederik P., and Max Welling. "Auto-encoding variational bayes." arXiv preprint arXiv:1312.6114 (2013).

[5] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012.

题外话：

国内很多人把那篇发在 Nature 上的“一款具有高级人工智能的游戏”的论文夸大了，实际上它有很多的局限性，它的强项在于需要快速反应的游戏，而在需要长远策略规划／逻辑推理上的游戏都表现不那么好，比如 pacman（吃豆人）。不难理解这是目前神经网络模型的本质困难之一。国外有个博客网站对待它的态度（包括现在很火的各种跟 DL 有关的模型的态度）我就比较赞同：What you wanted to know about AI

查看知乎原文

Log in or Sign up

Google 收购的是一群 geek 凑出来的全明星战队

漂亮的石头版主 Staff Member

Log in or Sign up

Google 收购的是一群 geek 凑出来的全明星战队

漂亮的石头 版主 Staff Member

漂亮的石头版主 Staff Member