2小时训练出一个明星,AI版孙燕姿动了谁的奶酪
2023/05/16 | 作者 王涵 | 编辑 张轶骁 | 收藏本文
一夜之间,“AI孙燕姿”爆火出圈。
南拳妈妈的《下雨天》、郭顶的《水星记》,甚至是数码宝贝的主题曲《Butterfly》、刘欢的《好汉歌》,这些风格迥异的曲目,都被“AI孙燕姿”完全驾驭。
其中,在B站播放量最高的,是“AI孙燕姿”翻唱的周杰伦的《发如雪》,拥有146万播放量,3.9万点赞。歌曲已经达到了以假乱真的地步,评论区几乎没有人能挑出违和的地方,“如果有人给我听这个,问我演唱的是真人还是AI,我会说真人。”
触角探入图文、视频行业后,音乐领域或将成为被AI攻陷的下一个行业。插画师、模特、文案的裁员潮还在继续,下一批失业受害者,难道要轮到歌手了吗?
2小时干声素材,训练出一首歌
“再不出来就要被AI取代了!”
5月4日长沙音乐节前,孙燕姿已经三年没有在内地有过演出,而就在半个月前,这个长时间不营业的“冷门歌手”,却频频活跃在公众视线里。
与此同时,热搜冒出一个新的词条,#AI出来后第一个失业的是孙燕姿#。
这是因为,近一个月里,有不少B站up主通过AI复刻孙燕姿嗓音的形式进行了许多歌曲二创。
“AI孙燕姿”演唱曲目。
AI歌手并不罕见。在“AI孙燕姿”之前,已经有“AI周杰伦”,“AI王菲”、“AI邓紫棋”的作品流传于B站,2022年6月,酷狗音乐还曾推出基于“凌音引擎”,以杨超越真人声音打造的首个AI歌手“超越AI”,但热度远远不能和“AI孙燕姿”相比。
有up主分析,这可能与孙燕姿本身的声音辨识度有关,吐字相对清晰,音色有一定的颗粒感,气息使用也自成一派,训练出的AI模型贴合了这样的特质,所以让人感觉像。
让“AI孙燕姿”完成一首歌曲并不难。网络上有不少博主都分享了相关的制作方法,他们主要是运用RVCDDSP-SVC、DiffSinger、Diff-svc和Sovits-svc等相关技术进行AI声音模型训练,“AI孙燕姿”的音频就是使用AI音色转换技术Sovits4.0版本(全称Sovits-svc)生成。
和AIGC图片生成的原理相似,“AI孙燕姿”也需要大量的“干声”数据投喂,也就是孙燕姿本人,未经过任何空间性质或后期处理和加工的纯人声,这些都可以通过网友整理的素材包直接使用。up主透露,大概2小时的“干声”就能够生成一首惟妙惟肖的作品,如果不够完美,还可以通过后期修音调整。
随着“AI孙燕姿”的意外爆红,那些原本已经沉寂的“AI歌手”也就重新回归到了B站。
一些非歌手的热门角色也开口唱了起来,比如“AI郭德纲”翻唱日文歌《冬の花》,“AI孙笑川”翻唱《这么可爱真是抱歉》。有up主们甚至还开启了点歌模式,留言选择歌曲+选择歌手,他们就能“定制”出相应的曲目。
“AI郭德纲”演唱曲目。
平台也为这些up主大开方便之门,4月28日至6月24日,B站音乐区推出“虚拟之声创作计划”,up主可选择话题“AI虚拟之声实验室”投稿,平台将给予优质稿件提供流量扶持和活动奖励。目前,该活动已经有1亿浏览,超34万次讨论。
而在“AI孙燕姿”火起来之前,AI也产出过不少的虚拟偶像。
最被人熟知的是2007年出生的初音未来,那个梳着葱绿色双马尾的少女,出生即巅峰,一首《甩葱歌》刷爆各大平台榜单,此后B站的洛天依、LOL推出的K/DA女团都是向着这个方向发展。
只是,这些AI歌手真的能取代歌手们吗?
有粉丝第一时间跳出来反对:“AI永远不可能取代歌手,我们去演唱会是为了听真实的、极致的、鲜活的、有氛围的,甚至可能会有瑕疵出现的live,歌曲会跟着歌手的喜怒哀乐去传达出不同的韵味,AI永远不可能赋予一首歌鲜活的生命力。”
有多少渗透,就有多少争议
AI技术渗入音乐行业的趋势已经非常明了,任何技术层面的问题都可以通过时间解决,但AI最根本的问题在于版权。
在B站“AI歌手”爆火之后,Sovits开发者Rcell很快发布紧急公告称,由于最近在B站等平台出现了众多使用svc (包括Sovits,diff-svc等)和未授权数据集训练明星、知名艺人、知名公众人物的模型,且这些作品在平台流量高,并且引起敏感性话题。为避免引起更严重的法律问题,Sovits仓库已经删除。
虽然部分创作者极力解释自己只是兴趣使然,并未商用获取收益,但其实际行为也已构成侵权。
北京中闻律师事务所合伙人律师王国华向媒体表示,AI翻唱主要是一些歌手声音的再现,会涉及对原创(歌手)声音的模仿,这种情况下往往会涉及表演者对声音所享有的相应权利。另外,通常判断构成侵权行为的方式,并不是以点击量或者是有偿无偿的方式判断,所以即使不以营利为目的,AI翻唱作品依旧属于侵权。
目前,原创者们对AI的态度划分为了两派。AI拥护者认为,“AI歌手”能放大IP的声音价值,应该支持继续探索。
比如,台湾歌手陈珊妮在今年3月发布了最新单曲《教我如何做你的爱人》,随后她宣布这首歌其实由自己的AI模型演唱的。
评论区里,有人感叹,“难怪觉得公主的vocal回春了,原来是AI唱的。”陈珊妮认为,身为创作人该在意的或许不是“我们是否会被取代”,而是“我们还可以做些什么”。
陈珊妮表示《教我如何做你的爱人》由AI模型演唱。
美国女歌手Grimes也在4月发布推文称,可以随意使用她的声音,不受惩罚。而且对于任何使用她声音的成功的AI生成歌曲,她都会分摊50%的版税。
AI抵制者则已经开始采取手段维护自己的权益。去年,美国唱片业协会向美国政府提交了一份AI开发者的名单,声称它们抓取受版权保护的作品来训练模型的行为是“未经授权使用的,侵犯了我们会员的权利”。
环球唱片执行副总裁迈克尔·纳什(Michael Nash)更是在一篇专栏文章中直言,人工智能音乐正在稀释市场,使原创作品更难找到,并侵犯了艺术家获得作品报酬的合法权利。
而在音乐之外,AI的版权争议还涉及很多领域,比如之前大火的AI换脸。
B站up主“瓜瓜Mars”就曾做过十余条“AI换脸系列”视频,恶搞对象包括林俊杰、王祖蓝、黄晓明等。2021年9月,林俊杰因被AI换脸做成鬼畜视频,起诉“瓜瓜Mars”,索赔27.5万,最终胜诉。
另外,还有近半年逐渐优化的AI绘画。2023年1月,全球知名图片提供商华盖创意(Getty Images)起诉热门人工智能(AI)绘画工具Stable Diffusion的开发者Stability AI,称其未经许可从其数据库中复制了超过1200万张图像,侵犯了公司的版权和商标保护措施。
为了尽力避开灰色地带,公司也在采取措施。百度文心一格规定,百度AI技术生成的画作版权归属于百度公司,并表示如果相关平台未来开发出来的生成图片侵犯到原作者权益,百度会提供投诉反馈通道,迅速为相关权利人提供权利救济渠道。AI绘画软件TIAMAT和Midjourney都选择在素材库中使用无版权的图片,以规避版权争议。
而在尚未有明确规定出台前,关于AI版权争议的话题可能会一直持续下去。
资本仍在攻城略地
AI作品被质疑没有灵魂,还可能涉及版权风波,但这些都不能抵挡资本的热情。
从ChatGPT到midjourney,再到“AI孙燕姿”,在文字、绘画、音乐等领域,AI未来的可能性被不断放大。
以OpenAI为代表的公司成了市场上的香饽饽。今年4月, OpenAI完成了 103 亿美元融资,估值达到 270 亿-290 亿美元(约合人民币 1900 亿-2000 亿元)。参与本轮融资的风投公司包括老虎全球管理、红杉资本、加州 Andreessen Horowitz、纽约 Thrive 和 K2 Global等。
国内市场也在紧跟AI发展的步伐。
IDC发布的《2023年V1全球人工智能支出指南》最新预测数据显示,中国人工智能(AI)市场支出规模将在2023年增至147.5亿美元,约占全球总规模十分之一。其预测,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率(CAGR)将超20%。
与AI相关的初创公司,在此刻备受资本青睐。
近两个月内,AI 数字人技术研发商硅真智能完成数千万元天使轮融资;虚拟偶像全栈式服务商万象科技完成数百万人民币的天使轮融资;继今年2月完成近千万美元A轮融资后,国内AI图像生成技术服务商Tiamat再次获数百万美元A+轮投资。
随着AI应用范围不断拓宽,AI也在推动市场催生一系列相关人才,改变未来职业走向。
OpenAI在最新发表的研究里提到,GPT对人际交往、手工操作、安全监管等相关的职业影响较少,但对语言(作家、编辑、律师、翻译)、数据(分析师、会计、统计师)、创意(设计师、艺术家、音乐家)等行业的影响是显著的,不过这种影响并不一定意味着就业机会或工资水平会下降,更有可能是导致职业结构、工作内容、技能需求等方面发生变化。
比如新兴职业之一,是模型训练相关的提示词工程师,也就是AI训练师,负责通过与AI交互写出相关提示,以帮助用户操作AI生成更完美的内容,并帮助公司培训员工使用这些工具。
据悉,谷歌投资的初创公司Anthropic,正在旧金山招聘“提示工程师和图书馆员”一职,薪水最高可达33.5万美元(约合人民币233万元)。
谷歌招聘“提示工程师和图书馆员”。
再比如AI修图师这类利用AI产出产品的输出型岗位,相对要求较低,上手学习时间也较短,已经逐步替代初级原画师。
脉脉高聘人才智库发布的《2023AIGC人才趋势报告》数据显示,今年1至2月国内AIGC(人工智能生成内容)招聘需求量同比上涨31.3%,创历史新高。
“AI孙燕姿”在音乐行业中发光发热,但这不会是AI最后一个攻下的城池。
相关报道