2小时训练出一个明星，AI版孙燕姿动了谁的奶酪

2023/05/16 | 作者王涵 | 编辑张轶骁

一夜之间，“AI孙燕姿”爆火出圈。

南拳妈妈的《下雨天》、郭顶的《水星记》，甚至是数码宝贝的主题曲《Butterfly》、刘欢的《好汉歌》，这些风格迥异的曲目，都被“AI孙燕姿”完全驾驭。

其中，在B站播放量最高的，是“AI孙燕姿”翻唱的周杰伦的《发如雪》，拥有146万播放量，3.9万点赞。歌曲已经达到了以假乱真的地步，评论区几乎没有人能挑出违和的地方，“如果有人给我听这个，问我演唱的是真人还是AI，我会说真人。”

触角探入图文、视频行业后，音乐领域或将成为被AI攻陷的下一个行业。插画师、模特、文案的裁员潮还在继续，下一批失业受害者，难道要轮到歌手了吗？

2小时干声素材，训练出一首歌

“再不出来就要被AI取代了！”

5月4日长沙音乐节前，孙燕姿已经三年没有在内地有过演出，而就在半个月前，这个长时间不营业的“冷门歌手”，却频频活跃在公众视线里。

与此同时，热搜冒出一个新的词条，#AI出来后第一个失业的是孙燕姿#。

这是因为，近一个月里，有不少B站up主通过AI复刻孙燕姿嗓音的形式进行了许多歌曲二创。

“AI孙燕姿”演唱曲目。

AI歌手并不罕见。在“AI孙燕姿”之前，已经有“AI周杰伦”，“AI王菲”、“AI邓紫棋”的作品流传于B站，2022年6月，酷狗音乐还曾推出基于“凌音引擎”，以杨超越真人声音打造的首个AI歌手“超越AI”，但热度远远不能和“AI孙燕姿”相比。

有up主分析，这可能与孙燕姿本身的声音辨识度有关，吐字相对清晰，音色有一定的颗粒感，气息使用也自成一派，训练出的AI模型贴合了这样的特质，所以让人感觉像。

让“AI孙燕姿”完成一首歌曲并不难。网络上有不少博主都分享了相关的制作方法，他们主要是运用RVCDDSP-SVC、DiffSinger、Diff-svc和Sovits-svc等相关技术进行AI声音模型训练，“AI孙燕姿”的音频就是使用AI音色转换技术Sovits4.0版本（全称Sovits-svc）生成。

和AIGC图片生成的原理相似，“AI孙燕姿”也需要大量的“干声”数据投喂，也就是孙燕姿本人，未经过任何空间性质或后期处理和加工的纯人声，这些都可以通过网友整理的素材包直接使用。up主透露，大概2小时的“干声”就能够生成一首惟妙惟肖的作品，如果不够完美，还可以通过后期修音调整。

随着“AI孙燕姿”的意外爆红，那些原本已经沉寂的“AI歌手”也就重新回归到了B站。

一些非歌手的热门角色也开口唱了起来，比如“AI郭德纲”翻唱日文歌《冬の花》，“AI孙笑川”翻唱《这么可爱真是抱歉》。有up主们甚至还开启了点歌模式，留言选择歌曲＋选择歌手，他们就能“定制”出相应的曲目。

“AI郭德纲”演唱曲目。

平台也为这些up主大开方便之门，4月28日至6月24日，B站音乐区推出“虚拟之声创作计划”，up主可选择话题“AI虚拟之声实验室”投稿，平台将给予优质稿件提供流量扶持和活动奖励。目前，该活动已经有1亿浏览，超34万次讨论。

而在“AI孙燕姿”火起来之前，AI也产出过不少的虚拟偶像。

最被人熟知的是2007年出生的初音未来，那个梳着葱绿色双马尾的少女，出生即巅峰，一首《甩葱歌》刷爆各大平台榜单，此后B站的洛天依、LOL推出的K/DA女团都是向着这个方向发展。

只是，这些AI歌手真的能取代歌手们吗？

有粉丝第一时间跳出来反对：“AI永远不可能取代歌手，我们去演唱会是为了听真实的、极致的、鲜活的、有氛围的，甚至可能会有瑕疵出现的live，歌曲会跟着歌手的喜怒哀乐去传达出不同的韵味，AI永远不可能赋予一首歌鲜活的生命力。”

有多少渗透，就有多少争议

AI技术渗入音乐行业的趋势已经非常明了，任何技术层面的问题都可以通过时间解决，但AI最根本的问题在于版权。

在B站“AI歌手”爆火之后，Sovits开发者Rcell很快发布紧急公告称，由于最近在B站等平台出现了众多使用svc (包括Sovits,diff-svc等)和未授权数据集训练明星、知名艺人、知名公众人物的模型，且这些作品在平台流量高，并且引起敏感性话题。为避免引起更严重的法律问题，Sovits仓库已经删除。

虽然部分创作者极力解释自己只是兴趣使然，并未商用获取收益，但其实际行为也已构成侵权。

北京中闻律师事务所合伙人律师王国华向媒体表示，AI翻唱主要是一些歌手声音的再现，会涉及对原创（歌手）声音的模仿，这种情况下往往会涉及表演者对声音所享有的相应权利。另外，通常判断构成侵权行为的方式，并不是以点击量或者是有偿无偿的方式判断，所以即使不以营利为目的，AI翻唱作品依旧属于侵权。

目前，原创者们对AI的态度划分为了两派。AI拥护者认为，“AI歌手”能放大IP的声音价值，应该支持继续探索。

比如，台湾歌手陈珊妮在今年3月发布了最新单曲《教我如何做你的爱人》，随后她宣布这首歌其实由自己的AI模型演唱的。

评论区里，有人感叹，“难怪觉得公主的vocal回春了，原来是AI唱的。”陈珊妮认为，身为创作人该在意的或许不是“我们是否会被取代”，而是“我们还可以做些什么”。

陈珊妮表示《教我如何做你的爱人》由AI模型演唱。

美国女歌手Grimes也在4月发布推文称，可以随意使用她的声音，不受惩罚。而且对于任何使用她声音的成功的AI生成歌曲，她都会分摊50%的版税。

AI抵制者则已经开始采取手段维护自己的权益。去年，美国唱片业协会向美国政府提交了一份AI开发者的名单，声称它们抓取受版权保护的作品来训练模型的行为是“未经授权使用的，侵犯了我们会员的权利”。

环球唱片执行副总裁迈克尔·纳什（Michael Nash）更是在一篇专栏文章中直言，人工智能音乐正在稀释市场，使原创作品更难找到，并侵犯了艺术家获得作品报酬的合法权利。

而在音乐之外，AI的版权争议还涉及很多领域，比如之前大火的AI换脸。

B站up主“瓜瓜Mars”就曾做过十余条“AI换脸系列”视频，恶搞对象包括林俊杰、王祖蓝、黄晓明等。2021年9月，林俊杰因被AI换脸做成鬼畜视频，起诉“瓜瓜Mars”，索赔27.5万，最终胜诉。

另外，还有近半年逐渐优化的AI绘画。2023年1月，全球知名图片提供商华盖创意（Getty Images）起诉热门人工智能（AI）绘画工具Stable Diffusion的开发者Stability AI，称其未经许可从其数据库中复制了超过1200万张图像，侵犯了公司的版权和商标保护措施。

为了尽力避开灰色地带，公司也在采取措施。百度文心一格规定，百度AI技术生成的画作版权归属于百度公司，并表示如果相关平台未来开发出来的生成图片侵犯到原作者权益，百度会提供投诉反馈通道，迅速为相关权利人提供权利救济渠道。AI绘画软件TIAMAT和Midjourney都选择在素材库中使用无版权的图片，以规避版权争议。

而在尚未有明确规定出台前，关于AI版权争议的话题可能会一直持续下去。

资本仍在攻城略地

AI作品被质疑没有灵魂，还可能涉及版权风波，但这些都不能抵挡资本的热情。

从ChatGPT到midjourney，再到“AI孙燕姿”，在文字、绘画、音乐等领域，AI未来的可能性被不断放大。

以OpenAI为代表的公司成了市场上的香饽饽。今年4月， OpenAI完成了 103 亿美元融资，估值达到 270 亿-290 亿美元（约合人民币 1900 亿-2000 亿元）。参与本轮融资的风投公司包括老虎全球管理、红杉资本、加州 Andreessen Horowitz、纽约 Thrive 和 K2 Global等。

国内市场也在紧跟AI发展的步伐。

IDC发布的《2023年V1全球人工智能支出指南》最新预测数据显示，中国人工智能（AI）市场支出规模将在2023年增至147.5亿美元，约占全球总规模十分之一。其预测，2026年中国AI市场将实现264.4亿美元市场规模，2021-2026五年复合增长率（CAGR）将超20%。

与AI相关的初创公司，在此刻备受资本青睐。

近两个月内，AI 数字人技术研发商硅真智能完成数千万元天使轮融资；虚拟偶像全栈式服务商万象科技完成数百万人民币的天使轮融资；继今年2月完成近千万美元A轮融资后，国内AI图像生成技术服务商Tiamat再次获数百万美元A+轮投资。

随着AI应用范围不断拓宽，AI也在推动市场催生一系列相关人才，改变未来职业走向。

OpenAI在最新发表的研究里提到，GPT对人际交往、手工操作、安全监管等相关的职业影响较少，但对语言（作家、编辑、律师、翻译）、数据（分析师、会计、统计师）、创意（设计师、艺术家、音乐家）等行业的影响是显著的，不过这种影响并不一定意味着就业机会或工资水平会下降，更有可能是导致职业结构、工作内容、技能需求等方面发生变化。

比如新兴职业之一，是模型训练相关的提示词工程师，也就是AI训练师，负责通过与AI交互写出相关提示，以帮助用户操作AI生成更完美的内容，并帮助公司培训员工使用这些工具。

据悉，谷歌投资的初创公司Anthropic，正在旧金山招聘“提示工程师和图书馆员”一职，薪水最高可达33.5万美元（约合人民币233万元）。