“超级人工智能”会突然出现吗?
2024/02/05 | via.媒体 英国《自然》周刊网站 | 收藏本文
超级智能的人工智能(AI)是否会突然出现,或者科学家是否能预见它的出现过程,而且有机会向世界发出预警?随着大型语言模型的诞生,这个问题最近备受关注。
聊天生成预训练转换器(ChatGPT)这类强大的大型语言模型在规模不断扩大的同时获得了巨量新能力。一些研究揭示AI或存在“涌现”现象,即AI模型以突然且不可预测的方式获得智能。但是,最近一项研究称,这种情况为“幻景”(即系统测试过程中产生的假象),并暗示创新能力是逐步形成的。
美国莫齐拉基金会的计算机科学家、从事人工智能审计研究的德博拉·拉吉说:“他们说‘没发生什么奇迹’,我认为说得好。这是一种非常好、扎实、基于实测的评价。”研究人员最近在新奥尔良举行的神经系统处理信息机器学习大会上介绍了这项新研究。
大型语言模型通常使用巨量文本或其他信息进行训练,并通过预测下一步会发生什么,生成现实答案。即使没有接受显性训练,它们也能进行翻译、解决数学问题以及写诗或编写计算机代码。模型越大(有些模型有1000亿以上的可调参数),往往表现越好。有些研究人员猜测,这些工具最终会实现通用人工智能(AGI),在执行大部分任务方面可与人类匹敌,甚至胜过人类。
这项新研究以多种方式测试了“涌现”的说法。在其中一项测试中,科学家对比了开放人工智能研究中心开发的4种规模的生成预训练转换器-3(GPT-3)进行4位数加法的能力。从绝对准确率的角度看,第三和第四种模型之间的成绩差别从几乎0%到接近100%不等。但是,如果考虑答案中正确预测的数字数量,这种趋势就不那么极端。研究人员还发现,他们可以对模型提出更多测试问题,以控制变化曲线。这种情况下,规模较小的模型有时能得出正确答案。
接下来,研究人员研究了谷歌LaMDA语言模型在完成几项任务方面的表现。这个模型突然表现出智能明显提高,往往执行的是答案分为对或错的多项选择任务,比如识别讽刺性语言或翻译格言。但是,当研究人员检测模型答对每个答案的概率时,“涌现”的迹象就消失了。
最后,研究人员转向计算机视觉,这个领域的“涌现”现象较少。他们训练模型压缩然后重构图像。只需设置严格的正确性门槛,就有可能引起明显的“涌现”现象。华盛顿大学从事人工智能和常识研究的计算机科学家崔艺珍说:“他们在设计研究方式这方面很有创造力。”
研究论文联合作者、斯坦福大学计算机科学家桑米·科耶乔说,考虑到有些系统展现出突然的“相变”,人们接受“涌现”的观点并非没有道理。他还指出,上述研究不能完全排除大型语言模型出现这种现象的可能性,更不用说未来的系统。但是,“迄今的科学研究有力地表明,语言模型的大多数方面其实是可预测的”。
相关报道