中企打造AI模型“可靠又便宜”
2024/11/15 | via.媒体  英国《金融时报》网站 | 收藏本文
面临美国的芯片限制和比西方同行更少的预算,中国的人工智能(AI)公司正通过降低成本来创建具有竞争力的模型。
通过专注于用小型数据集来训练人工智能模型,以及雇用薪资不高但技术熟练的计算机工程师等策略,诸如零一万物和深度求索公司这样的初创企业已经降低了价格。阿里巴巴等大型科技集团也加入了价格战,努力降低推理成本(调用大语言模型生成回应的花费),使其仅为美国同行的一小部分。
在北京注册的零一万物公司称,通过建立一种面向较少数据进行训练的模型(这种模型的算力需求也较低)以及优化硬件,该公司降低了推理成本。该公司的首席执行官李开复对《金融时报》说,中国的实力在于制造出让人真正负担得起的推理引擎,然后推动其应用激增。
在加利福尼亚大学伯克利分校的研究人员近日发布的一项排名中,零一万物公司的Yi-Lightning(闪电)模型名列前茅。字节跳动、阿里巴巴和深度求索等中国企业的模型也榜上有名。
李开复表示,Yi-Lightning的预训练成本仅相当于开放人工智能研究中心等公司公布的大模型预训练成本的一小部分。这样做的目的不是提供“最好的”模型,而是提供一个可以让开发人员用“1/10至1/5价格”开发软件的具有竞争力的模型。
包括零一万物、深度求索、阶跃星辰等在内的中国人工智能团队采用了所谓的专家模型策略。这种策略不是在庞大数据库中一次性训练出一个密集模型,而是将许多经行业特定数据训练的神经网络结合起来。
研究人员认为,该策略对于在较低计算能力下实现与密集模型相同的智能水平至关重要。工程师们必须通过多个“专家”而非单一模型来安排训练过程。
近年来,中国的人工智能企业正在竞相开发最高质量的数据集来训练这些“专家”,以使自己在竞争中脱颖而出。
李开复表示,对数据进行标记和排序需要做很多费时费力的工作,但中国拥有大量工程人才且人工成本相对较低,因而在这方面比美国更具竞争力。他说,中国的优势在于建设得又好又快,又可靠又便宜。
相关报道