AI深度观察 | 大模型火了一年半,AI还在“钻木取火”?
2024/06/24 | 作者 宫靖 | 编辑 段文 | 收藏本文
伴随着AI大模型的新一轮进化,这个夏天,人工智能正在引领一波新的热潮。
美国当地时间6月18日,AI大模型的主要显卡芯片供应商英伟达收涨3.51%,市值升至3.34万亿美元,一度超越微软和苹果等科技巨头,成为全球市值最高的上市企业。从2022年11月末ChatGPT发布算起,英伟达市值已上涨9倍以上。
5月至今两个月以来,围绕AI大模型,一个月内十几场发布会,每一场都极具科技含量:国际市场,AI2.0时代的开创者OpenAI公司公布了ChatGPT-4o,AI大模型概念的提出者谷歌,以及微软、Facebook母公司Meta,都有新发布;6月11日,苹果推出Apple Intelligence,其缩写还恰好与AI一模一样。在中国,从腾讯、阿里巴巴到字节跳动,也进行了新发布。
这十几场发布会,每一场都极具科技含量。梦幻的场景,激昂的演讲,全世界的倾听。
然而,人们兴奋着,也失望着。
兴奋的是,重要性堪比电的发明,对人类影响可能比互联网、移动互联网更大的AI,依然在进化、突破,快速接近着人类智能。失望的是,被寄予厚望的AI大模型离期望值依然较远,其应用水平仍在人类初级助手里打转。
或许,是时候冷静盘点一下AI大模型了。
作为经常用来与AI类比的互联网和移动互联网,起码应该具备三个特点:一是拥有海量的大众用户,二是在企业端、政府端被广泛应用,三是成为社会基础设施并带来极大的经济效率提升。更直观地看,互联网、移动互联网都催生了经济新形态,产生了微软、谷歌、亚马逊、苹果、腾讯、阿里巴巴、百度和华为等现象级科技企业,数十亿的现代人接受着这些科技巨头的服务。
从以上三个角度看,从2022年11月30日ChatGPT发布至今,AI大模型在爆火并持续进化一年半之后,其应用水平或者说被接受程度远未达预期,只能说还在发展初期。最为用户接受的ChatGPT,其日活量在尝鲜期过后,下降较快。业内公认的是,迄今为止,没有任何一款AI大模型的应用或产品的使用能达到流行的移动应用水平。
有悲观的业界声音开始发出,代表着AI2.0时代开启的AI大模型,或许依然不会带来真正的AI爆发,这有可能就像十多年前计算机视觉潮(同为AI技术潮)一样,潮来,也将潮去。要迎来比肩互联网和移动互联网的AI爆发,人类或许还需要等待更多时间。
近日,蚂蚁集团CTO何征宇的“钻木取火”观点在业内广为流传。他在蚂蚁技术日上公开表示:AI发展目前还处于钻木取火阶段,尽管我们能够利用AI技术,但还没有找到最高效办法,仍然没有找到AI的本质。
这并非危言耸听,事实上,创造了AI大模型Transformer架构的谷歌,其CEO桑达尔·皮查伊近日受访时也表示:AI浪潮仍处于早期阶段。在本轮AI热潮中再次创业的李开复也表示“感觉AI发展仍处早期”。
当然,更多AI领域专家认为,即使AI大模型不是AI爆发的终级形态,但它带来的数字化浪潮和潜力,依然具有想象力。
“AI对于人类来说,一定是和人类发明了电一样的级别。AI大模型,一年前我曾认为它拥有和互联网、移动互联网一样的级别,现在觉得当时有些乐观了。但是,AI大模型依然代表迄今AI技术发展的最高点,只不过我们需要回归理性去看待它。让大模型做它能做到的,让它进步化得更智能、更有用,它依然具有很大的空间。”第四范式总裁胡时伟的话,具有代表性。
杀手级AI爆款应用并没有出现
全世界一直在思考,互联网、移动互联网之后,下一个对人类产生划时代影响的技术是什么?大数据、云计算、区块链、元宇宙、人工智能AI都曾在候选名单之中。AI就是近年的新晋胜者,几乎获得科技界一致认同。
“我认为,人类未来回望历史,AI技术的地位一定是超过互联网和移动互联网的。互联网没有智能,AI可以产生类似人的智能这一点已经被确认,因此它为人类带来变革的想像空间更大。”这是一位资深行业研究者的话,在《凤凰周刊》记者的采访中,被其他受访对象广泛认同。
在深入讨论AI之前,可以略回顾一下互联网和移动互联网给人类带来的改变。
互联网和计算机一起,给人类带来了第三次工业革命即信息革命。互联网诞生至今50多年,几乎完成了全世界普及,给全球绝大部分个人、企业和政府机关的生活、生产和运行,带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起,谷歌、亚马逊等搜索类、电商类企业崛起。
将移动通信和互联网二者结合起来的移动互联网,在2010年前后与智能手机结合,迎来爆发。在不到10年的时间内,移动互联网对全球大部分个人完成覆盖,大量企业和政府端为完成To C服务,进行了移动互联网变革。在中国,大部分60岁以上老人近年也成为智能手机用户。
全球范围内,崛起于互联网时期的科技企业,几乎全部利用移互技术进行升级,新出现了Facebook、YouTube、微信、抖音、淘宝等10亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等,初步带来便捷的数字生活、生产方式。
AI技术的提出时间在1956年,甚至比互联网诞生的1969年都要早13年。长期以来,AI都是一门被认为重要但难得其法去使用的技术。
2013年至2017年,第一轮AI技术热潮——计算机视觉热潮掀起。在这轮热潮中,2016年,谷歌的AlphaGo成为第一个战胜围棋世界冠军的人工智能机器人,我国的“AI四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来AI的爆发,大量资本投资失利,大量创业者艰难维持。
2022年11月30日,ChatGPT横空出世,基于Transformer架构的AI大模型自此被捧为AI技术的新未来。
人类通过20余年的继承式学习,才能具有一项或多项专有技能,胜任生活中各种角色,而人工智能则通过数月甚至更短时间的数据训练,拥有比人高得多的技能甚至是智能。
ChatGPT引发的震憾则是全方位的,机器通过类似人的神经网络一样的学习方式,将所见、所听、所看结合既有数据、记忆,在瞬间进行成千上万的并行计算,再以文本、图表、语音、视频等方式表达出来。似乎,人之所以为人的知、情、意,人工智能除了情、意之外,在认知的数量方面超过和辗压人类,质量方面正无限接近人,甚至是超过多数人。
至今,全球大多数科技企业均涉足AI大模型发展和训练,作为科技领先国家的美国和中国,更是各自诞生数百个大模型。这被形象地称为“百模大战”,甚至“千模大战”。
大量的资本冲向AI领域,席卷全球的AI热潮再次涌起。一年半的喧闹之后,人们暮然回首,与投资端的喧闹相比,市场对AI大模型的热情,还远远不及互联网、移动互联网。
除了训练AI大模型需要巨量GPU芯片,因此将芯片企业英伟达一度送上全美市值第一宝座外,这轮热潮下还没有诞生新的科技巨头。全球最好的AI大模型ChatGPT的日活至今只有数千万,国内大模型应用虽然均呈现向好态势,但C端日活和B端尝鲜者数量均不理想。
至今,全行业都在追问:杀手级、现象级或者说爆款AI应用,何时会出现?简单的问题,直击灵魂。业内回答,乐观者说1年内,中观者说2至3年,悲观者说“无法预计”。
6月13日,北京智源人工智能研究院院长王仲远接受媒体群访时说,回顾移动互联网时代或更早期的技术革命,每次新技术的出现都需要一定的周期,包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时,能够解决真实用户需求的C端爆款应用才会出现。“因此,对于C端爆款应用,我们还需保持一定的耐心。未来,我们可能会先从B端看到非常好用的工具,然后C端应用会逐步出现。”
AI大模型峥嵘初显
尽管可以说AI至今还不能与互联网、移动互联网的技术地位类比,但谁也没法否认AI大模型带来的数字化潜力。“人工智能+”的时代,确实是到来了。
市场研究机构Gartner分析师张桐告诉《凤凰周刊》:“近期的AI领域一系列发布,还是带来了一些惊喜。一是在多模态方面进步巨大,OpenAI、谷歌、微软的最新发布,均强调了处理图像、语音的多模态能力,这与之前主要在文本处理方面的进步,有显著区别,十分关键。二是中国各家企业的AI大模型发布,显示的技术进步程度表明中国没有被美国明显拉开。”他特意提到了美国斯坦福大学AI团队被证实套壳抄袭国内清华与面壁智能团队的AI大模型。
从中国老百姓的角度,也可以从多个方面感受到AI大模型的扑面春风。
首先,我们熟悉的各类应用APP,正在被AI入驻甚至“爆改”。百度搜索关键词的结果,第一条不再是互联网广告或百度词条,而是文心一言大模型给出的智能回答。微信也嵌入了元宝小程序,用户可以进行AI搜索、文档总结、AI作图等应用。淘宝的“淘宝问问”可以用语言方式与用户交互并推荐商品。金融应用支付宝,只要下拉首页,就可以领取并使用AI金融助理、生活助理。
多位业内人士认为,虽然将AI大模型应用于传统APP只是大模型比较简单的初步应用,但这种趋势将继续,并且逐步向深度应用发展。这对公众直观认识AI大模型还是较为有用。
第二个变化是AI大模型正成为人们的工作和生活助手。文本能力方面,AI大模型能力进化最大,已达到上下文数百万至1000万汉字的水平。因此,多数大模型应对文本、文档、书籍的要点总结,简单文章生成和PPT制作等,已显得轻松。音频转文本、视频生成等多模态能力,已让短视频创作的效率明显提高。
第三个变化是AI大模型开始入驻手机。6月11日,苹果2024年全球开发者大会宣布苹果智能(Apple Intelligence)系统适用于iPhone、iPad和Mac等操作系统。会后产生了民间新梗“Siri终于成了人工智能,不再是人工智障了”。苹果AI发布,使世界大致感知到了AI大模型手机的雏形,AI获得类操作系统的权限,可以跨APP调用、统合信息,包括通讯录等隐私信息,最终可以告知你“我太太的航班几点降落”。
瑞银近期的一项预测是,生成式AI智能手机将从2023年的5000万部稳步增长,至2027年将达到5.83亿部,且到2027年收入或达5130亿美元。
下一步AI大模型场景或是汽车。4月,一年一度的北京车展举行,展会的最大亮点并不是117款新车型全球首发,而是AI大模型“上车”。据不完全统计,已有20家左右的汽车品牌宣布AI大模型正式“上车”。
未来,AI上车后大致的场景是:司机可以用自然语言与汽车进行交互,如“打开一半的右边窗户”“空调开到23度”,还可以问“现在堵车的原因是什么”。当然,也要预防坏人提出的“打开车门”要求。
千行百业尝鲜AI大模型
今年4月初,阿里巴巴宣布入职一位“AI员工”——程序员通义灵码,其将担任阿里云代码助理,它具备扎实编程基础和200多种编程语言技能,可优化代码、生成测试框架和用例,提高工作效率。它也背了阿里的KPI:未来20%阿里云代码将由其编写。
事实上,AI员工现象,已是全球科技企业常态。高度规则化的程序编写,正是AI大模型最擅长的工作之一。
通义成为阿里云001号AI员工图/阿里云官微
AI客服是当前行业公认的最适合落地AI大模型的领域。近年第一代智能客服是生活中的槽点,相声、小品、脱口秀中诞生了大量的梗,我们不少人也对其狂喊过“请转人工”。AI大模型加持的智能客服显然会更加智慧,在猜你想问、推你所推方面会更加精准。
值得一提的是,随着数字经济的推进,发达国家、地区以及我国近年的各行各业均在主动或被动地推进数字化进程。AI大模型的出现,客观上对这一进程起着巨大助力作用。例如,阿里巴巴官方资料显示,其大模型已经在汽车、航空、天文、矿业、教育、医疗等行业落地,解决各行各业实际面临的具体问题。例如,在重工业领域,一汽集团联合阿里云打造了汽车行业首个大模型BI应用——GPT-X,通过智能化数据治理和商业分析能力,助力一汽提升决策效率。
王仲远认为,2023年之后,人工智能逐步进入通用人工智能时代,其最大的特点是泛化性、通用性和跨领域的特性,这将影响所有行业。一些行业受到的影响会更快,比如大模型在生成摘要方面效果非常好,因此对所有与文书相关的工作、文案处理等效率提升作用显著。再比如,当前的文生图、文生视频技术,虽然还处于早期阶段,但都是提升效率的工具。“只要与这些能力相关,各行各业都会受益,并且未来会不断出现好用的工具。”
业内专家同时普遍认为,目前AI大模型在大量行业的应用,还处于初级阶段,还不够智能。“可以起到一些效率提升作用,是智能助手,但带来革命性变化,还谈不上。”张桐说。
AI爆发或需更多等待
业内的一个共识是,从各方面看,AI技术可能已经接近首次爆发。但无法排除的可能是,AI也有可能需要一个更长的周期才能迎来爆发。
无论如何,有几个现实是AI大模型当前发展不容回避的。
首先,AI大模型十分烧芯片、烧数据,甚至烧电力。每一个大模型动辄需要上万块英伟达GPU,每块价值1万至1.5万美元以上。每次训练还需要规模达百亿、千亿级TOKEN的数据物料,无论英文数据物料还是中文数据物料,现有物料都难以接续。
很难想象,大模型的耗电量会成为能源专家的最新关注点。训练Open AI的GPT-3模型耗电量相当于120个美国家庭一年的用电量。在这背后,大模型的CPU(中央处理器)和GPU(图形处理器)等硬件在执行复杂计算时会消耗大量电力,同时大模型所需巨大内存带来的读写操作,同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找,在这方面,中国的电力基础设施将比美国更容易支持本国的AI大模型发展。”张桐说。
相比动辄数十亿级别的投入,AI大模型带来的收入还十分有限,甚至暂时可以忽略。
其次,AI大模型还有“硬伤”,即不够靠谱的问题仍然没有解决。虽然大部分时候,AI大模型的推理和判断结果令人欣喜,但时而“一本正经地胡说八道”还是会出现。目前任何大模型都不能幸免。在生活中,AI大模型的错误我们可以容忍,可以一笑置之,但这却关乎大模型商用的前途,例如金融系统和制造业的容错空间就极小。
再次,AI大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外,内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术,最终一定是像互联网一样低门槛的。
“AI技术已发展了30年,现在说它还处于钻木取火阶段可能有些夸张,但它仍然处于技术早期这不可否认。”一位大厂的AI专家表示。
科学技术发展带有不可确定性,没有人是先知。或许,AI爆发只差临门一脚。又或许,AI大模型并不是AI爆发的最终解。那么,我们可能需要继续等待。