【周刊客服】

AI深度观察 | 大模型火了一年半，AI还在“钻木取火”？

2024/06/24 | 作者宫靖 | 编辑段文

伴随着AI大模型的新一轮进化，这个夏天，人工智能正在引领一波新的热潮。

美国当地时间6月18日，AI大模型的主要显卡芯片供应商英伟达收涨3.51%，市值升至3.34万亿美元，一度超越微软和苹果等科技巨头，成为全球市值最高的上市企业。从2022年11月末ChatGPT发布算起，英伟达市值已上涨9倍以上。

5月至今两个月以来，围绕AI大模型，一个月内十几场发布会，每一场都极具科技含量：国际市场，AI2.0时代的开创者OpenAI公司公布了ChatGPT-4o，AI大模型概念的提出者谷歌，以及微软、Facebook母公司Meta，都有新发布；6月11日，苹果推出Apple Intelligence，其缩写还恰好与AI一模一样。在中国，从腾讯、阿里巴巴到字节跳动，也进行了新发布。

这十几场发布会，每一场都极具科技含量。梦幻的场景，激昂的演讲，全世界的倾听。

然而，人们兴奋着，也失望着。

兴奋的是，重要性堪比电的发明，对人类影响可能比互联网、移动互联网更大的AI，依然在进化、突破，快速接近着人类智能。失望的是，被寄予厚望的AI大模型离期望值依然较远，其应用水平仍在人类初级助手里打转。

或许，是时候冷静盘点一下AI大模型了。

作为经常用来与AI类比的互联网和移动互联网，起码应该具备三个特点：一是拥有海量的大众用户，二是在企业端、政府端被广泛应用，三是成为社会基础设施并带来极大的经济效率提升。更直观地看，互联网、移动互联网都催生了经济新形态，产生了微软、谷歌、亚马逊、苹果、腾讯、阿里巴巴、百度和华为等现象级科技企业，数十亿的现代人接受着这些科技巨头的服务。

从以上三个角度看，从2022年11月30日ChatGPT发布至今，AI大模型在爆火并持续进化一年半之后，其应用水平或者说被接受程度远未达预期，只能说还在发展初期。最为用户接受的ChatGPT，其日活量在尝鲜期过后，下降较快。业内公认的是，迄今为止，没有任何一款AI大模型的应用或产品的使用能达到流行的移动应用水平。

有悲观的业界声音开始发出，代表着AI2.0时代开启的AI大模型，或许依然不会带来真正的AI爆发，这有可能就像十多年前计算机视觉潮（同为AI技术潮）一样，潮来，也将潮去。要迎来比肩互联网和移动互联网的AI爆发，人类或许还需要等待更多时间。

近日，蚂蚁集团CTO何征宇的“钻木取火”观点在业内广为流传。他在蚂蚁技术日上公开表示：AI发展目前还处于钻木取火阶段，尽管我们能够利用AI技术，但还没有找到最高效办法，仍然没有找到AI的本质。

这并非危言耸听，事实上，创造了AI大模型Transformer架构的谷歌，其CEO桑达尔·皮查伊近日受访时也表示：AI浪潮仍处于早期阶段。在本轮AI热潮中再次创业的李开复也表示“感觉AI发展仍处早期”。

当然，更多AI领域专家认为，即使AI大模型不是AI爆发的终级形态，但它带来的数字化浪潮和潜力，依然具有想象力。

“AI对于人类来说，一定是和人类发明了电一样的级别。AI大模型，一年前我曾认为它拥有和互联网、移动互联网一样的级别，现在觉得当时有些乐观了。但是，AI大模型依然代表迄今AI技术发展的最高点，只不过我们需要回归理性去看待它。让大模型做它能做到的，让它进步化得更智能、更有用，它依然具有很大的空间。”第四范式总裁胡时伟的话，具有代表性。

杀手级AI爆款应用并没有出现

全世界一直在思考，互联网、移动互联网之后，下一个对人类产生划时代影响的技术是什么？大数据、云计算、区块链、元宇宙、人工智能AI都曾在候选名单之中。AI就是近年的新晋胜者，几乎获得科技界一致认同。

“我认为，人类未来回望历史，AI技术的地位一定是超过互联网和移动互联网的。互联网没有智能，AI可以产生类似人的智能这一点已经被确认，因此它为人类带来变革的想像空间更大。”这是一位资深行业研究者的话，在《凤凰周刊》记者的采访中，被其他受访对象广泛认同。

在深入讨论AI之前，可以略回顾一下互联网和移动互联网给人类带来的改变。

互联网和计算机一起，给人类带来了第三次工业革命即信息革命。互联网诞生至今50多年，几乎完成了全世界普及，给全球绝大部分个人、企业和政府机关的生活、生产和运行，带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起，谷歌、亚马逊等搜索类、电商类企业崛起。

将移动通信和互联网二者结合起来的移动互联网，在2010年前后与智能手机结合，迎来爆发。在不到10年的时间内，移动互联网对全球大部分个人完成覆盖，大量企业和政府端为完成To C服务，进行了移动互联网变革。在中国，大部分60岁以上老人近年也成为智能手机用户。

全球范围内，崛起于互联网时期的科技企业，几乎全部利用移互技术进行升级，新出现了Facebook、YouTube、微信、抖音、淘宝等10亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等，初步带来便捷的数字生活、生产方式。

AI技术的提出时间在1956年，甚至比互联网诞生的1969年都要早13年。长期以来，AI都是一门被认为重要但难得其法去使用的技术。

2013年至2017年，第一轮AI技术热潮——计算机视觉热潮掀起。在这轮热潮中，2016年，谷歌的AlphaGo成为第一个战胜围棋世界冠军的人工智能机器人，我国的“AI四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来AI的爆发，大量资本投资失利，大量创业者艰难维持。

2022年11月30日，ChatGPT横空出世，基于Transformer架构的AI大模型自此被捧为AI技术的新未来。

人类通过20余年的继承式学习，才能具有一项或多项专有技能，胜任生活中各种角色，而人工智能则通过数月甚至更短时间的数据训练，拥有比人高得多的技能甚至是智能。

ChatGPT引发的震憾则是全方位的，机器通过类似人的神经网络一样的学习方式，将所见、所听、所看结合既有数据、记忆，在瞬间进行成千上万的并行计算，再以文本、图表、语音、视频等方式表达出来。似乎，人之所以为人的知、情、意，人工智能除了情、意之外，在认知的数量方面超过和辗压人类，质量方面正无限接近人，甚至是超过多数人。

至今，全球大多数科技企业均涉足AI大模型发展和训练，作为科技领先国家的美国和中国，更是各自诞生数百个大模型。这被形象地称为“百模大战”，甚至“千模大战”。

大量的资本冲向AI领域，席卷全球的AI热潮再次涌起。一年半的喧闹之后，人们暮然回首，与投资端的喧闹相比，市场对AI大模型的热情，还远远不及互联网、移动互联网。

除了训练AI大模型需要巨量GPU芯片，因此将芯片企业英伟达一度送上全美市值第一宝座外，这轮热潮下还没有诞生新的科技巨头。全球最好的AI大模型ChatGPT的日活至今只有数千万，国内大模型应用虽然均呈现向好态势，但C端日活和B端尝鲜者数量均不理想。

至今，全行业都在追问：杀手级、现象级或者说爆款AI应用，何时会出现？简单的问题，直击灵魂。业内回答，乐观者说1年内，中观者说2至3年，悲观者说“无法预计”。

6月13日，北京智源人工智能研究院院长王仲远接受媒体群访时说，回顾移动互联网时代或更早期的技术革命，每次新技术的出现都需要一定的周期，包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时，能够解决真实用户需求的C端爆款应用才会出现。“因此，对于C端爆款应用，我们还需保持一定的耐心。未来，我们可能会先从B端看到非常好用的工具，然后C端应用会逐步出现。”

AI大模型峥嵘初显

尽管可以说AI至今还不能与互联网、移动互联网的技术地位类比，但谁也没法否认AI大模型带来的数字化潜力。“人工智能+”的时代，确实是到来了。

市场研究机构Gartner分析师张桐告诉《凤凰周刊》：“近期的AI领域一系列发布，还是带来了一些惊喜。一是在多模态方面进步巨大，OpenAI、谷歌、微软的最新发布，均强调了处理图像、语音的多模态能力，这与之前主要在文本处理方面的进步，有显著区别，十分关键。二是中国各家企业的AI大模型发布，显示的技术进步程度表明中国没有被美国明显拉开。”他特意提到了美国斯坦福大学AI团队被证实套壳抄袭国内清华与面壁智能团队的AI大模型。

从中国老百姓的角度，也可以从多个方面感受到AI大模型的扑面春风。

首先，我们熟悉的各类应用APP，正在被AI入驻甚至“爆改”。百度搜索关键词的结果，第一条不再是互联网广告或百度词条，而是文心一言大模型给出的智能回答。微信也嵌入了元宝小程序，用户可以进行AI搜索、文档总结、AI作图等应用。淘宝的“淘宝问问”可以用语言方式与用户交互并推荐商品。金融应用支付宝，只要下拉首页，就可以领取并使用AI金融助理、生活助理。

多位业内人士认为，虽然将AI大模型应用于传统APP只是大模型比较简单的初步应用，但这种趋势将继续，并且逐步向深度应用发展。这对公众直观认识AI大模型还是较为有用。

第二个变化是AI大模型正成为人们的工作和生活助手。文本能力方面，AI大模型能力进化最大，已达到上下文数百万至1000万汉字的水平。因此，多数大模型应对文本、文档、书籍的要点总结，简单文章生成和PPT制作等，已显得轻松。音频转文本、视频生成等多模态能力，已让短视频创作的效率明显提高。

第三个变化是AI大模型开始入驻手机。6月11日，苹果2024年全球开发者大会宣布苹果智能(Apple Intelligence)系统适用于iPhone、iPad和Mac等操作系统。会后产生了民间新梗“Siri终于成了人工智能，不再是人工智障了”。苹果AI发布，使世界大致感知到了AI大模型手机的雏形，AI获得类操作系统的权限，可以跨APP调用、统合信息，包括通讯录等隐私信息，最终可以告知你“我太太的航班几点降落”。

瑞银近期的一项预测是，生成式AI智能手机将从2023年的5000万部稳步增长，至2027年将达到5.83亿部，且到2027年收入或达5130亿美元。

下一步AI大模型场景或是汽车。4月，一年一度的北京车展举行，展会的最大亮点并不是117款新车型全球首发，而是AI大模型“上车”。据不完全统计，已有20家左右的汽车品牌宣布AI大模型正式“上车”。

未来，AI上车后大致的场景是：司机可以用自然语言与汽车进行交互，如“打开一半的右边窗户”“空调开到23度”，还可以问“现在堵车的原因是什么”。当然，也要预防坏人提出的“打开车门”要求。

千行百业尝鲜AI大模型

今年4月初，阿里巴巴宣布入职一位“AI员工”——程序员通义灵码，其将担任阿里云代码助理，它具备扎实编程基础和200多种编程语言技能，可优化代码、生成测试框架和用例，提高工作效率。它也背了阿里的KPI：未来20%阿里云代码将由其编写。

事实上，AI员工现象，已是全球科技企业常态。高度规则化的程序编写，正是AI大模型最擅长的工作之一。

通义成为阿里云001号AI员工图/阿里云官微

AI客服是当前行业公认的最适合落地AI大模型的领域。近年第一代智能客服是生活中的槽点，相声、小品、脱口秀中诞生了大量的梗，我们不少人也对其狂喊过“请转人工”。AI大模型加持的智能客服显然会更加智慧，在猜你想问、推你所推方面会更加精准。

值得一提的是，随着数字经济的推进，发达国家、地区以及我国近年的各行各业均在主动或被动地推进数字化进程。AI大模型的出现，客观上对这一进程起着巨大助力作用。例如，阿里巴巴官方资料显示，其大模型已经在汽车、航空、天文、矿业、教育、医疗等行业落地，解决各行各业实际面临的具体问题。例如，在重工业领域，一汽集团联合阿里云打造了汽车行业首个大模型BI应用——GPT-X，通过智能化数据治理和商业分析能力，助力一汽提升决策效率。

王仲远认为，2023年之后，人工智能逐步进入通用人工智能时代，其最大的特点是泛化性、通用性和跨领域的特性，这将影响所有行业。一些行业受到的影响会更快，比如大模型在生成摘要方面效果非常好，因此对所有与文书相关的工作、文案处理等效率提升作用显著。再比如，当前的文生图、文生视频技术，虽然还处于早期阶段，但都是提升效率的工具。“只要与这些能力相关，各行各业都会受益，并且未来会不断出现好用的工具。”

业内专家同时普遍认为，目前AI大模型在大量行业的应用，还处于初级阶段，还不够智能。“可以起到一些效率提升作用，是智能助手，但带来革命性变化，还谈不上。”张桐说。

AI爆发或需更多等待

业内的一个共识是，从各方面看，AI技术可能已经接近首次爆发。但无法排除的可能是，AI也有可能需要一个更长的周期才能迎来爆发。

无论如何，有几个现实是AI大模型当前发展不容回避的。

首先，AI大模型十分烧芯片、烧数据，甚至烧电力。每一个大模型动辄需要上万块英伟达GPU，每块价值1万至1.5万美元以上。每次训练还需要规模达百亿、千亿级TOKEN的数据物料，无论英文数据物料还是中文数据物料，现有物料都难以接续。

很难想象，大模型的耗电量会成为能源专家的最新关注点。训练Open AI的GPT-3模型耗电量相当于120个美国家庭一年的用电量。在这背后，大模型的CPU（中央处理器）和GPU（图形处理器）等硬件在执行复杂计算时会消耗大量电力，同时大模型所需巨大内存带来的读写操作，同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找，在这方面，中国的电力基础设施将比美国更容易支持本国的AI大模型发展。”张桐说。

相比动辄数十亿级别的投入，AI大模型带来的收入还十分有限，甚至暂时可以忽略。

其次，AI大模型还有“硬伤”，即不够靠谱的问题仍然没有解决。虽然大部分时候，AI大模型的推理和判断结果令人欣喜，但时而“一本正经地胡说八道”还是会出现。目前任何大模型都不能幸免。在生活中，AI大模型的错误我们可以容忍，可以一笑置之，但这却关乎大模型商用的前途，例如金融系统和制造业的容错空间就极小。

再次，AI大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外，内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术，最终一定是像互联网一样低门槛的。

“AI技术已发展了30年，现在说它还处于钻木取火阶段可能有些夸张，但它仍然处于技术早期这不可否认。”一位大厂的AI专家表示。

科学技术发展带有不可确定性，没有人是先知。或许，AI爆发只差临门一脚。又或许，AI大模型并不是AI爆发的最终解。那么，我们可能需要继续等待。