人类是如何做到从寥寥无几的例子里领悟「新概念」的? 李竞捷,大学生/学习神经科学与机器学习中/航空爱好者 不太了解其他领域,仅就视觉里的识别与 CV 方面简单谈一下我的看法,以后有时间会再补上一些文献。 根据我的观点,题主所说的仅靠少量例子归纳的原理在于 人脑复杂的 Top-down 机制。 人脑并不是靠某一个神经元表示物体分类的,特定神经元活动的 pattern 才表示了相应物体。 人脑 IT 皮层中,复杂物体被以束来表示,相似物体在 IT 皮层内激活的区域比较接近。 我们知道人在视网膜和大脑里面是将视觉层级化抽象处理,从最初的 center-on/off 那种感受野到 V1 里对边缘方向敏感、再到 V4 里逐渐形成 shape……最后到 IT 皮层,实现视觉的识别这样的高级功能。 图 1 人脑主要视觉通路 现在计算机视觉方面稀疏编码的神经网络处理信息的模式跟人脑还是有一些相似型的。 但是,人脑简单的从下到上,把简单特征通过神经网络组织起来的信息处理方式叫做 bottom-up flow ,传统计算机视觉里的卷积神经网络什么的,基本也是一种类似 bottom-up 的模型。 但是人脑不仅这样向上逐层加工信息,还有复杂的 Top-down 机制,即从高级脑区,自上而下调节低级皮层。除记忆因素影响外还受到注意等因素的影响。对人脑 Top-down 机制的研究目前还比较基础,对这个很难设计实验。 另外的,不同于计算机的神经网络,人脑是靠特定神经元活动的图谱来表示一个物体的,这个以前有一个很著名的“祖母细胞”,后来被证明是错误的。这样特定的活动图谱还可以联系记忆的因素,让你联想起来比较相近的物体。 同时,人脑 IT 皮层内比较相似的物体的 colume 表示是比较近的 这样也方便吧比较相似的物体联系在一起。我们看到新的物体并不是像机器那样,重新训练一个新的模型,首先人脑低级特征的处理是自动的,其次,人脑还可以不断调用以前的记忆和相似的物体训练的结果,还有复杂的 Top-down 机制来调控。 这些都是计算机的神经网络目前还没有太模拟出来的部分。我觉得主要就是这些机制才使得人脑可以通过少量的例子学会一个新的物体。 上面的内容主要是以前看神经科学原理那本书看到的内容,图片也全部来自于《神经科学原理》,有空我再针对性看看这方面的文献,有机会我再补充补充我的回答,回答不太严谨的地方希望大家能指出。 阅读原文