Google 2014 年收购的人工智能公司 DeepMind 在业界有怎样的实力和地位? SZZhang,in probability we trust 上点干货以区别科普媒体的介绍: DeepMind 从公司性质上来说与其他众多基于 machine learning (ML) 的 startup 有本质上的不同: DeepMind 实际上是一家小型研究院,目前他们的主要任务是发论文。 它的组织结构类似于缩小版的微软研究院/Google Research,它不注重于将技术产品化,而纯粹将自己的方向放在 ML 的科学研究上(也就他们会在自己的主页上放一个大 link 上书“Publication”,点进去都是 ICML,NIPS 的论文),个人更倾向于把 DeepMind 当作 Google Research 在 London 的一个特殊分部。 从总体研究方向上来说,目前他们搞的东西就一个:神经网络(又名深度学习)。 拿他们最近的三个工作为例: 1. HUMAN LEVEL CONTROL THROUGH DEEP REINFORCEMENT LEARNING 2. NEURAL TURING MACHINES 3. DRAW: A RECURRENT NEURAL NETWORK FOR IMAGE GENERATION 对于 1, 也就是“一款具有高级人工智能的游戏”,它实际上是 Reinforcement Learning + Neural Network, 基本框架依旧是 Q-Learning,有趣的地方在于,input 是直接的游戏屏幕画面,也就是 pixel-level,这一部分使用 CNN 来处理,而改进的 Q-Learning 使用了 replay memory [1] (93 年的 idea)。原论文是 Nature 上的要付费,技术细节戳这里:https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf 对于 2. 这个工作很有意思,故名思义就是图灵机的神经网络版本,一个创新点在于使用了 memory (当然本质上的创新就不用说了), 而不是单纯的将 model 的信息都存在 weight 里,相关的工作还包括 Facebook 的 Memory Network [2]和 NYU Fergus (当然也是 Facebook Research 了)的[3]。 对于 3. 这个工作非常炫酷,结合了 variational autoencoder[4] (引用以 Max Welling 的工作为例,DeepMind 的就不引了) 和 和 RNN,这篇论文是我见过的所有 generative model 在 CIFAR10 和 MNIST 上迄今为止的最棒的结果。他们有一个 youtube 的 demo 墙外的童鞋可以感受一下:https://www.youtube.com/watch?v=Zt-7MI9eKEo 从人员构成上来说,这家公司大概几十个人(?至少一年前是这样的),当初被 google 以 400M 收购,算一下平均一个人值不少钱,其中偏计算机的大部分都是 Deep Learning 系的,很多都是原来 Hinton, Lecun, Bengio, Schmidhuber,Welling 的学生。又因为地处 london,跟 UCL 有不少渊源,里面有一些 UCL 出来的搞 Neuroscience 的,需要提一下的是 Hinton 原来在 UCL 当过教授。 几个扛把子的(创始人就不用说了):Alex Graves (深入搞过 RNN 应该都久闻其名), Karol Gregor (搞理论物理的),Ilya Sutskever(2012NIPS 那篇影响深远的 CNN 论文的二作 [5])。 综上,这是一群 geek 凑出来的 deep learning 全明星战队。 Reference: [1] Long-Ji Lin. Reinforcement learning for robots using neural networks. Technical report, DTIC Document, 1993. [2] Weston, Jason, Sumit Chopra, and Antoine Bordes. "Memory networks." arXiv preprint arXiv:1410.3916 (2014). [3] http://arxiv.org/abs/1503.08895 (刚上线没多久的 paper 没找到 google cite,直接上链接) [4] Kingma, Diederik P., and Max Welling. "Auto-encoding variational bayes." arXiv preprint arXiv:1312.6114 (2013). [5] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012. 题外话: 国内很多人把那篇发在 Nature 上的“一款具有高级人工智能的游戏”的论文夸大了,实际上它有很多的局限性,它的强项在于需要快速反应的游戏,而在需要长远策略规划/逻辑推理上的游戏都表现不那么好,比如 pacman(吃豆人)。不难理解这是目前神经网络模型的本质困难之一。国外有个博客网站对待它的态度(包括现在很火的各种跟 DL 有关的模型的态度)我就比较赞同:What you wanted to know about AI 查看知乎原文