AI越进化越跟人类大脑像!Meta找到了机器的“前额叶皮层”

AI越进化越跟人类大脑像!Meta找到了机器的“前额叶皮层”

鱼羊 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI

说出来你可能不信,有一只AI刚刚被证明,处理语音的方式跟大脑谜之相似。

甚至在结构上都能相互对应——

科学家们在AI身上直接定位出了“视觉皮层”。

这项来自Meta AI等机构的研究一经po出,立马在社交媒体上炸开了锅。一大波神经科学家和AI研究者前往围观。

LeCun称赞这是“出色的工作”:自监督Transformer分层活动与人类听觉皮层活动之间,确实密切相关。

还有网友趁机调侃:Sorry马库斯,但AGI真的快要来了。

不过,研究也引发了一些学者的好奇。

例如麦吉尔大学神经科学博士Patrick Mineault提出疑问:

我们发表在NeurIPS的一篇论文中,也尝试过将fMRI数据模型联系起来,但当时并不觉得这俩有啥关系。

所以,这到底是一项怎样的研究,它又是如何得出“这只AI干起活来像大脑”的结论的?

AI学会像人脑一样工作

简单来说,在这项研究中,研究人员聚焦语音处理问题,将自监督模型Wav2Vec 2.0同412名志愿者的大脑活动进行了比较。

这412名志愿者中,有351人说英语,28人说法语,33人说中文。研究人员给他们听了大约1个小时的有声书,并在此过程中用fMRI对他们的大脑活动进行了记录。

模型这边,研究人员则用超过600小时的无标签语音来训练Wav2Vec 2.0。

对应志愿者的母语,模型也分为英语、法语、中文三款,另外还有一款是用非语音声学场景数据集训练的。

而后这些模型也听了听志愿者同款有声书。研究人员从中提取出了模型的激活。

相关性的评价标准,遵照这个公式:

其中,X为模型激活,Y为人类大脑活动,W为标准编码模型。

从结果来看,自监督学习确实让Wav2Vec 2.0产生了类似大脑的语音表征。

从上图中可以看到,在初级和次级听觉皮层,AI明显预测到了几乎所有皮层区域的大脑活动。

研究人员还进一步发现了AI的“听觉皮层”、“前额叶皮层”到底长在哪一层。

图中显示,听觉皮层与Transformer的第一层(蓝色)最吻合,而前额叶皮层则与Transformer的最深一层(红色)最吻合。

此外,研究人员量化分析了人类感知母语和非母语音素的能力差异,并与Wav2Vec 2.0模型进行对比。

他们发现,AI也像人类一样,对“母语”有更强的辨别能力,比如,法语模型就比英语模型更容易感知来自法语的刺激。

上述结果证明了,600小时的自监督学习,就足以让Wav2Vec 2.0学习到语言的特定表征——这与婴儿在学说话的过程中接触到的“数据量”相当。

要知道,之前DeepSpeech2论文认为,至少需要10000小时的语音数据(还得是标记的那种),才能构建一套不错的语音转文字(STT)系统。

再次引发神经科学和AI界讨论

对于这项研究,有学者认为,它确实做出了一些新突破。

例如,来自谷歌大脑的Jesse Engel称,这项研究将可视化滤波器提升到了一个新的层次。

现在,不仅能看到它们在“像素空间”里长啥样,连它们在“类脑空间”中的模样也能模拟出来了:

又例如,前MILA和谷歌研究员Joseph Viviano认为,这个研究还证明了fMRI中的静息态(resting-state)成像数据是有意义的。

但在一片讨论中,也出现了一些质疑的声音。

例如,神经科学博士Patrick Mineault除了指出自己做过相似研究但没得出结论外,也给出了自己的一些质疑。

他认为,这篇研究并没有真正证明它测量的是“语音处理”的过程。

相比于人说话的速度,fMRI测量信号的速度其实非常慢,因此贸然得出“Wav2vec 2.0学习到了大脑的行为”的结论是不科学的。

当然,Patrick Mineault表示自己并非否认研究的观点,他自己也是“作者的粉丝之一”,但这项研究应该给出一些更有说服力的数据。

此外也有网友认为,Wav2vec和人类大脑的输入也不尽相同,一个是经过处理后的波形,但另一个则是原始波形。

对此,作者之一、Meta AI研究员Jean-Rémi King总结:

模拟人类水平的智能,确实还有很长的路要走。但至少现在来看,我们或许走在了一条正确的道路上。

你认为呢?

论文地址:https://arxiv.org/abs/2206.01685

参考链接:[1]https://twitter.com/patrickmineault/status/1533888345683767297[2]https://twitter.com/JeanRemiKing/status/1533720262344073218[3]https://www.reddit.com/r/singularity/comments/v6bqx8/toward_a_realistic_model_of_speech_processing_in/[4]https://twitter.com/ylecun/status/1533792866232934400

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年6月29日
下一篇 2022年6月29日

相关推荐

  • 中国智慧园区行业现状深度研究与投资趋势分析报告

    一、概述 智慧园区是运用数字化技术,以全面感知和广泛联结为基础的人机事物深度融合体,具备主动服务、智能进化等能力特征的有机生命体和可持续发展空间。智慧园区的建设融合了新一代信息与通…

    2022年8月9日
  • 科学家:人类接近达到第一类文明

    卡尔达肖夫指数以能源消耗作为三种类型文明的定义。(公有领域) 一组科学家说,人类的文明在200年内即可达到卡尔达肖夫(Kardashev)模型描述的第一类文明的水平。 近期一篇发表…

    2022年8月16日
  • 融信数联完成近亿元B轮融资

    来源:新华网 近日,北京融信数联科技有限公司(以下简称“融信数联”)完成近亿元B轮融资。本轮融资由理想智胜领投,正心睿盈、中留联创、诚立信、衡庐雅望、惠誉东方以及多位个人投资者参与…

    2022年7月3日
  • 银河系外围遭不明力量扰动,科学家:有巨物掠过

    银河系外围恒星正在像波浪一样起伏运动。 “盖亚”银河全图。红圈为人马座矮星系所在位置。ESA / Gaia / DPAC 最近一些来自瑞典隆德大学的学者在“盖亚”恒星数据库中发现,…

    2022年9月24日
  • 接下来的十年中迈向超现实元宇宙

    在接下来的十年中,元宇宙将朝着在超现实虚拟环境中的沉浸式体验发展,其中充满了看起来和听起来与我们完全一样的化身。今天,几乎所有虚拟世界中的化身和虚拟环境都是由艺术家和创作者精心打造…

    2022年6月22日
  • 德科立研究报告:长距离传输专家,高端产品全面开花

    (报告出品方/作者:国泰君安证券,王彦龙,黎明聪) 1.盈利预测 公司深耕光通信行业 20 余年,主要业务涵盖光收发模块、光放大器和光 传输子系统的研发、生产与销售,产品应用于电信…

    2022年8月3日
  • 颠覆人类认知,人类竟是地球的外星人

    宇宙中还有其他生命吗?到目前为止,人类还不知道地球上第一个生命体诞生在哪里,为什么他们热衷于寻找地外生命?当我们思考这些问题时,我们有没有想过这样的可能性。 人类之所以要探索宇宙,…

    2022年8月16日
  • 为什么说CSGO正在逐步娱乐化?关键是休闲玩家的基数实在太大了

    众所周知,CSGO是一款竞技游戏,由于游戏有着异于常人的竞技平衡和内容,使得这款游戏的竞技性是非常高的,可是,我们再回过头来看CSGO这几年的更新,我们又会发现一个不争的事实,事实…

    2022年7月24日
  • 国人玩家耗时2年,完成全球首杀!最终幻想14最难副本终被攻克

    还记得2019年最终幻想14中的新高难度副本:绝亚历山大尚未开放时,制作人吉田曾经在直播中说,绝亚历山大是一个设计概念非常复杂的副本,他觉得这个副本全球只要有一支队伍能通关就足够了…

    2022年7月16日
  • 2020款iPhoneSE2和今年新款iPhoneSE3 实际使用对比

    日常感觉2代基本够用了,因为A13处理器已经强于大部分安卓用的处理器了,A15在这4.7寸的屏幕上性能感觉有点过剩。毕竟两者现在的价格差了一千左右(二手)如果有小屏需求的或者是备用…

    2022年8月15日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息