专家创建“新图灵测试”能够更好评估人工智能的隐秘能力

英国《新科学家》周刊网站6月14日报道,包括美国谷歌公司多名专家在内的400多位人工智能(AI)研究者建议升级著名的图灵测试,以提高为人工智能技术评分的能力

报道称,近年来,人工智能语言模型表现出惊人的与人对话的能力,这要归功于实验规模不断扩大——我们有了更强的算力和庞大的训练数据集。谷歌公司的一名工程师近日对一个模型印象深刻,甚至宣称这个模型已经有了意识(虽然遭到很多人的质疑)。有科研人员预计这些模型的规模仍将继续扩大,并在今后几年里展现出新的能力。

为评估目前的技术水平并为迎接未来更强大的模型做好准备,来自132家机构的442名研究者花费两年时间,创造出一套取代图灵测试的方法,用于评估人工智能模型的隐秘能力,且可在必要时扩展评估范围。这套方法名为“超越模仿游戏基准”(BIG-bench),包含204项不同的任务,覆盖语言学、数学、棋类等一系列主题。根据设计,这些任务将无法被当前最先进的模型完全解决。

科研人员在一篇介绍“超越模仿游戏基准”的论文中指出,它将成为一项重要工具,可以启发未来的研究,以及识别和预见新兴人工智能的任何颠覆性新能力或潜在的有害影响。

人类专家完成了这204项任务,为每项任务确定了平均分和最高基准分。科研人员发现,虽然算力的提高帮助人工智能模型取得越来越好的成绩,但人工智能在大多数任务中的表现仍然不如人类。

科研人员还发现,扩大人工智能模型的规模并没有提高其在某些任务中的表现,比如涉及长文本的逻辑推理。这等于暗示说,对于一些智力领域而言,单单扩大规模并不能解决问题。事实上,这项研究还表明,规模甚至可能带来问题,比如在某些情况下,衡量社会偏好的一些测试会给较大的模型打出较低的分数。

该研究团队的核心成员包含多位谷歌专家,但该公司没有回应记者的采访请求。

英国萨里大学的阿德里安·希尔顿认为,图灵测试未必过时,但对现代人工智能而言不够有效,或者说覆盖面不够广。图灵测试最初还被用来评估智力,尽管其是否能够评估智力是值得商榷的。希尔顿怀疑此次公布的新基准恐怕也无法衡量真正的智力。

他说:“我认为这是一种有效的测试,但我不会据此认为,说一台机器很聪明与说它有意识是一回事。我相信,设置一组基准是比较一种机器学习算法与另一种算法的一个办法,也是比较一种人工智能与另一种人工智能的一个办法。但我并不认为这一定能解答关于智力的问题。有了机器学习技术,机器就能谱写乐曲,甚至回答问题、写散文,且是以一种比较有说服力、比较接近人类的方式做这些事情。但这真的是智力吗?我认为并非如此。”

来源:参考消息网

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年6月19日
下一篇 2022年6月19日

相关推荐

  • 手机×相机联名,为了高端化还是提升影像能力?

    窗外,淅淅沥沥的雨还在下着,南方的龙舟水如盆泼,我收起雨伞擦拭着湿热天气下额头滴落的水珠,向吧台后方偷懒的服务员要上一份咖啡,等待着一位朋友的光临。滴滴滴,微颤的桌面上,手机屏幕告…

    2022年6月14日
  • 项目验收报告 科技计划项目验收

    科技计划类项目是科技部门为支持科研院所、企事业单位从事科技创新的一项扶持政策。该类项目的重要特点是项目承担方须与科技主管部门签订任务书,在项目实施期满后由科技主管部门组织进行项目验…

    2022年7月18日
  • Meta分享Codec Avatar进展:曾要170个摄像头,现只需一台手机

    (映维网Nweon 2022年06月14日)自2019年正式公开介绍旨在创建图片真实感虚拟数字人的Codec Avatar项目以来,Meta就一直在积极探索各种优化方式。在日前公布…

    2022年6月15日
  • 智己汽车站在新世界的原点,提出“新世界汽车智能五大标准”

    6月14日,智己汽车举行了一场线上发布会,在打破电动汽车漂移距离最长世界纪录之后,智己汽车再一次推开了新时代的大门,从智能汽车的智能驾驶、场景智能化、社交能力、持续净化能力以及多元…

    2022年6月18日
  • OPPO Reno7 A手机在日本发布:搭载骁龙695 5G芯片

    IT之家 6 月 17 日消息,据 GSMArena 报道,OPPO 最近在日本市场推出了 OPPO Reno7 A 智能手机 —— 这是去年 Reno5 A 的后续产品。这款手机…

    2022年6月18日
  • 智能手机充电排行榜 realme充电速度最快

    今天让我们了解一下上半年主要的智能手机充电速度排行榜,看看你的机型情况如何? 1、realme GT Neo 3,充电时间14分钟。 2、红魔7S Pro:充电时间17分钟。 3、…

    2022年7月23日
  • 虚拟主播变现两极分化揭秘

    每经记者:温梦华 毕媛媛 每经编辑:张海妮 “虚拟主播Shoto在B站直播2小时收入超百万,付费率达到了73.3%!” 惊人的吸金能力,将虚拟主播拉到观众面前。今年以来,元宇宙热潮…

    2022年8月1日
  • 喜欢买彩票的人都很穷吗?他们都是什么心理?

    老罗,轴承厂员工,58岁,两个儿子,大儿子30岁,已经给他买了房子娶了老婆,小儿子27岁,还没结婚,房子也还没着落。 老罗每天加班加点,一个月能赚个7000块,在小县城里,这工资算…

    2022年6月30日
  • 读《偷影子的人》

    《偷影子的人》讲述了一个老是受班上同学欺负的瘦弱小男孩,因为拥有一种特殊能力而强大:他能“偷别人的影子”,因而能看见他人心事,听见人们心中不愿意说出口的秘密。他开始成为需要帮助者的…

    2022年4月30日
  • “未来买房跟买包一样容易”,专家回应

    极目新闻记者 曾凌轲 7月29日,易居研究院智库中心研究总监严跃进在一次直播采访中提及,未来房子会朝着消费品概念发展,未来买房会像买包一样容易,在网上就能下单。隔日,“买房跟买包一…

    2022年8月4日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息