
智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影
你想粉一個聲音獨一無二的愛豆嗎?你腦海里冒出來的第一個甜美聲音是什么樣?現在,這一切都有了答案。
今年開學季,上海音樂學院出現了一位粉頭發、大眼睛、頭頂一根呆毛的元氣少女偶像歌手。這正是科大訊飛旗下訊飛音樂的首位AI虛擬歌手Luya(露芽),剛出道就已經擁有兩首單曲——《北極星與流行雨》和《迷霧之中的微光》,其中,《迷霧之中的微光》在QQ音樂熱歌榜排名17。

從洛天依、初音未來到華智冰、柳葉熙,越來越多的虛擬偶像已經“出道”,唱歌、跳舞都不在話下。而Luya與她們最大的不同則是“成長型”,她擁有甜美可愛的外形、聲音,還能夠在技術、能力不斷提升的同時不斷成長。
值得一提的是,Luya的聲音并不是真人發出,而是由AI創造,科大訊飛AI研究院副院長、訊飛音樂首席科學家江源說:“依托科大訊飛研究院在語音和人工智能領域的技術儲備,使得Luya的形象逐漸飽滿。”
1999年成立的科大訊飛,已經在語音及AI技術領域下積淀了20余年,2019年官宣進入音樂賽道。科大訊飛高級副總裁、訊飛研究院院長胡國平曾在訊飛音樂發布會上說:“語音技術融入音樂,勢必對音樂行業有深刻影響,甚至幫助整個行業實現質的飛躍。”
智東西與科大訊飛AI研究院副院長、訊飛音樂首席科學家江源進行了深入交流,從Luya的“出道故事”,去揭開AI虛擬歌手背后的黑科技及AI+音樂未來的融合路徑。
一、訊飛首個AI虛擬歌手,成長型、音色“唯一”打造強標識
2019年7月訊飛音樂成立,致力于專業音樂制作、多元化宣發、藝人經紀及AI音樂創新產品研究。截至2022年9月,訊飛音樂出品歌曲總播放量突破570億次,播放過億歌曲100余首,各音樂平臺上榜歌曲數百首。作為訊飛音樂的首位AI虛擬歌手,Luya印證了訊飛音樂在AI+音樂領域探索的更進一步。
作為一名歌手,其亮點離不開優秀的作品和好聽的音色,這放在AI虛擬歌手上同樣如此。
不過,為了打造虛擬偶像的獨特性,很多玩家則選擇了完全不同的路徑,一種是虛擬偶像的動作、聲音、思考都來自于幕后穿戴動作捕捉設備的真人,也就是“中之人”;一種則是用AI創造音色,為虛擬偶像打造獨一無二的聲音。
選擇后一種方式的訊飛音樂,其首個AI虛擬歌手Luya的音色也成為了其亮點。
那么具體而言,打造一個AI虛擬歌手需要幾步?確定人設、AI創造音色、打造外形、出道。對于Luya來說,其中最重要的就是AI創造音色,江源告訴智東西,這一套流程下來,用AI創造Luya的音色他們就花了大量時間磨合調試。
最初,Luya的設定就是性格爽朗、古靈精怪的天才少女,這之后,她的外形和音色也都延續了這一特點。在Luya發布單曲下方的評論區中,可以看到網友討論的焦點都在其甜美、元氣滿滿的聲音上。

Luya的音色并不是來源于某一個具體的真人,而是訊飛音樂基于AI不斷調節、優化聲音屬性的同時去創造一個獨一無二的聲音。
江源告訴智東西,為了找到符合Luya人設的聲音,他們構建了一個擁有海量音色的聲音庫,通過多維的手段,利用這些音色建立一個音色空間模型,再將上百萬的聲音樣本進行拆解、調節,這個調節過程可能包括聲音的甜美程度、性別變化、年輕程度等。
訊飛音樂在對這些細節不斷組合調整的過程中,使得Luya的聲音形象逐漸飽滿、成熟。
除此以外,不同于一個成熟的歌手,Luya的定位更像一個不斷成長的大學生,同時也是在音樂世界徜徉探索的“精靈”。
提及AI虛擬歌手,你腦海中的雛形可能是更早期的洛天依、初音未來,以及最近引起熱議的樂華娛樂虛擬偶像團體A-SOUL,但Luya與這些虛擬偶像最大的不同還在于,“她是成長型歌手”。
江源說:“和洛天依、初音未來的不同之處在于,Luya并沒有被在最開始就定義成完美,她更像我們的女兒,隨著技術和能力的進步,而不斷成長。”
而這些特點也凸顯出了AI虛擬歌手Luya的強標識性特征。那么,在獨一無二的Luya背后,還有哪些黑科技?
二、甜美、元氣的聲音,由AI創造
說的不如唱的好聽,我們可以先來感受一下Luya的真正實力。
這兩首歌正是Luya已經發布的單曲,這些元氣滿滿的聲音不是現實中某人發出,而是由AI創造的,這背后的黑科技也正是科大訊飛的核心優勢。
不同于很多AI虛擬歌手背后的“中之人”,世界上,幾乎找不出與Luya的音色完全相同的人聲,這背后正是依靠訊飛音樂的“x-vocal”技術。
上文我們提到的訊飛音樂建立了一個具有海量音色的聲音庫,再由技術專家、混音師、音樂創作者、愛好者對聲音進行挑選、制造,在這個龐大的音色空間中,找到最終符合Luya聲音定位的專屬音色,而這個就是“x-vocal”技術的實現過程。
從技術角度而言,其難度在于,即使訊飛音樂構建了一個龐大的音色空間,但其中可調節的維度及其對應的物理解釋、人對其的物理感知量,都是很難去進行調節的。
因此,江源解釋道,他們會定標一些聲音的程度,如年齡層次、甜美程度、高亢沙啞等,通過人工判斷并給予其人工定標,再圍繞著這一過程,去拆解主線條上的維度。
再加上“聲音是一個動態變化的過程,因此AI虛擬歌手背后的技術難度其實非常高”。
從音樂角度來看,就如同“一千個觀眾眼中有一千個哈姆雷特”,每個人會對音樂作品產生不同的理解。因此,Luya背后不光蘊含著黑科技,還有音樂向的理解存在。
在用AI創造Luya音色的過程中,技術人員對于音色的理解和評價逐漸從技術角度延伸到大眾語言的角度。“我認為這是非常有趣的,對我們有很大的幫助和提升。”
具體而言,聲音對于一個人有時候具有代表性作用,你可能聽到“咳嗽聲”就能知道是誰,但相比于作為歌手的聲音,其判斷維度有很大不同。因此,如果單純按照說話的聲音去構建一個發音模型,對于歌聲來說是不適用的。
因此,訊飛音樂在技術積淀的同時,也在加深對音樂的理解,而Luya也在不斷成長。江源說:“我們希望打造一個不斷成長,并給Luya不斷賦能的過程。”
目前而言,訊飛音樂對于Luya的包裝仍然是不成熟的,隨著技術和能力的不斷提升,Luya的未來具有無限可能。
三、成長型AI虛擬歌手,攜手上音“搞事業”
很多人可能會有這樣的好奇,現在已經有很多真人偶像,為什么我們還會需要AI虛擬歌手?想要回答這個問題,我們可以先從真人偶像和AI虛擬歌手的共性說起。
事實上,AI虛擬歌手并不神秘,她的成長路徑和真人歌手有很多相似之處,其真正價值在于音樂作品,AI技術也只是其中的輔助。
江源談道,中之人的優勢在于可以和粉絲進行交互,除音樂外,這些虛擬偶像被包裝的元素可能更多。而相對于聲音創作,中之人會比AI的流程更加輕松一點。
歸根結底,音樂本身的價值更為關鍵。談及Luya的下一步計劃,江源透露,他們還是希望通過音樂內容去撬動更多的粉絲群體,更強調她的音樂屬性。
因此,為了積淀Luya在音樂領域的實力,同時助力AI+音樂領域的融合,Luya在今年開學季進入上海音樂學院“音樂工程系·訊飛音樂 聯合研發中心”。

接下來Luya的成長計劃將著眼于AI輔助創作能力提升,初期,Luya將憑借其AI合成的音色參與歌曲演繹,未來會進一步延伸至AI輔助作詞、作曲等領域。
江源還談道,Luya會在上音的實驗室里聯合專業領域進行音樂創作等,而這一部分內容也會進一步賦予給Luya,這也是訊飛音樂推動Luya未來能力不斷成長的關鍵過程。
總的來看,AI虛擬歌手與真人歌手并不會相互取代,反之,憑借其優秀的音樂作品會擁有一眾粉絲群體。
Luya現階段會基于自己的人設特點,從人格化角度與喜愛她的粉絲、聽眾交流回復,接下來會通過構建自己的知識庫,依托知識積累沉淀,與粉絲進行更直接的互動。
“我相信,AI虛擬歌手會變得更加有血有肉。”江源說。他們的價值也是可以不斷被挖掘,并超出人類預期的。他認為,三年到五年的時間,AI虛擬歌手就可以在音樂領域構建自己的知識庫,擁有專家級別的理解和認識。
依托于Luya的成長型特性,她也會隨著訊飛音樂在語音和AI技術領域的不斷發展而成長。
AI技術的發展逐漸走向千行百業,并真正落地其中。AI與音樂的融合并不止于此,訊飛音樂也一直在探索創新路徑。
結語:訊飛音樂解開AI+音樂的奧秘
AI+音樂已經成為AI技術應用落地的重要領域,科大訊飛依托于其深厚的技術積累,開始發力,Luya也憑借其甜美的音色在各大平臺吸引了一眾粉絲。不同于其他領域,人們對于藝術的看法總是千人千面,江源說:“這也是我們在研發過程中覺得有趣的一點。”Luya讓我們看到了訊飛音樂在這一領域探索的無限可能。
未來,隨著Luya越來越成熟,AI虛擬歌手更加立體,AI技術的不斷進步,這一領域也許會迸發更多元的可能性。

