應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

Marvel.AI幫名人合成語(yǔ)音,讓他們躺著也掙錢

2021-05-19 08:52 智東西

導(dǎo)讀:隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉(zhuǎn)語(yǔ)音的模型。

近日美國(guó)一家人工智能公司Veritone推出了一款名叫Marvel.AI的聲音平臺(tái),為名人提供聲音克隆服務(wù)。

公司總裁Ryan Steelberg說(shuō):“對(duì)于名人而言,除了使用個(gè)人形象的廣告代言,他們的聲音也是工作業(yè)務(wù)的一部分,但通常名人們的時(shí)間比較緊張,沒(méi)有足夠的時(shí)間去演播室錄音”。所以,Veritone公司就推出了這項(xiàng)服務(wù),幫助名人們生成他們聲音的深層復(fù)制品(deepfakes of their voices),并在需要的時(shí)候使用。

一、Marvel.AI兩種服務(wù)模式:可自助,可個(gè)性化定制

隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉(zhuǎn)語(yǔ)音的模型。但機(jī)器語(yǔ)音太過(guò)生硬,為了制作出精品的人聲語(yǔ)音系統(tǒng),Veritone作為世界首個(gè)人工智能操作系統(tǒng)aiWare的創(chuàng)建者,最近搭建了Marvel.AI語(yǔ)音平臺(tái),該平臺(tái)可以制作合成語(yǔ)音,讓內(nèi)容創(chuàng)作者、名人等用戶生成他們聲音的復(fù)制品,以達(dá)到難辨真?zhèn)蔚娜寺曅Ч糜陔娕_(tái)、有聲讀物或是其他平臺(tái)的應(yīng)用。

對(duì)用戶而言,Marvel.AI將提供兩種服務(wù)。

第一種是自助服務(wù)模式,人們可以從原有的聲音目錄中選擇自己的喜歡的模型,然后根據(jù)需要?jiǎng)?chuàng)建語(yǔ)音。這種模式類似于亞馬遜和微軟等公司之前提供的變音服務(wù)。

第二種是個(gè)性化制定模式,客戶只需要提交自己的聲音數(shù)據(jù)。之后,Veritone本著“一切為了顧客服務(wù)”的原則,為他們創(chuàng)建一個(gè)克隆的語(yǔ)音模型,并保存在公司的系統(tǒng)中。只要客戶有需求,就能立刻把模型調(diào)出開始復(fù)制使用。Marvel.AI還將搭建一個(gè)市場(chǎng),為那些有潛在需求的客戶,提供多樣化的聲音模型選擇,但目前其定價(jià)不明確。

Steelberg堅(jiān)信,對(duì)這此類服務(wù)市場(chǎng)是有需求的,他們已經(jīng)準(zhǔn)備好商業(yè)化應(yīng)用了。

二、為名人省時(shí)省力,但存在信用風(fēng)險(xiǎn)

Veritone雖然自稱是一家“人工智能公司”,但其大部分收入來(lái)自廣告和內(nèi)容授權(quán)。該公司有個(gè)Veritone Licensing部門,對(duì)包括CBS和CNN等在內(nèi)的廣播公司,以及NCAA和美國(guó)網(wǎng)球公開賽等體育組織擁有的視頻檔案進(jìn)行授權(quán)。

Ryan Steelberg說(shuō)聲稱,與那些專注于人工智能技術(shù)的初創(chuàng)公司相比,Veritone在授權(quán)和廣告方面的經(jīng)驗(yàn)將賦予其優(yōu)勢(shì)。但這對(duì)廣告商和贊助商來(lái)說(shuō),無(wú)疑是非常耗錢又費(fèi)時(shí)的項(xiàng)目。畢竟,名人都是靠自身形象、聲音來(lái)引流的,但當(dāng)大眾粉絲們發(fā)現(xiàn),自己的偶像或是崇拜者連聲音都是合成的,那之后還會(huì)消費(fèi)其代言的產(chǎn)品嗎?

三、克服機(jī)械音、提高安全度是Veritone的發(fā)展重點(diǎn)

近年來(lái),在廣告領(lǐng)域,語(yǔ)音合成技術(shù)被廣泛應(yīng)用。在這波語(yǔ)音創(chuàng)作洪流中,Veritone平臺(tái)的發(fā)展取決于合成人聲的真實(shí)性。它是否能帶動(dòng)大眾的情緒,聲音聽起來(lái)要像是人類發(fā)出的,而不是機(jī)器。

此外,對(duì)于這項(xiàng)技術(shù),在社會(huì)上也存在諸多爭(zhēng)議。由于Marvel.AI可以創(chuàng)建任何音頻模型,這就給個(gè)人隱私泄露和音頻濫用問(wèn)題的出現(xiàn)提供了可能。例如之前出現(xiàn)的不法之徒,利用語(yǔ)音合成來(lái)進(jìn)行電話詐騙的案例,讓語(yǔ)音克隆服務(wù)的安全度遭到質(zhì)疑。

Steelberg也曾提到,通過(guò)復(fù)制音頻檔案,該項(xiàng)技術(shù)能夠讓已經(jīng)逝世人的聲音“復(fù)活”。從技術(shù)層面上看,這是一項(xiàng)不錯(cuò)的創(chuàng)新技術(shù);但從道德角度上看,這確實(shí)有點(diǎn)讓人感到毛骨悚然。比如通過(guò)人工智能復(fù)活英國(guó)戴安娜王妃的語(yǔ)音,用于商品代言,消費(fèi)者們會(huì)買單嗎?

結(jié)語(yǔ):智能語(yǔ)音發(fā)展的同時(shí),也要保障用戶安全

在全面進(jìn)入數(shù)字化的時(shí)代,智能語(yǔ)音服務(wù)是未來(lái)的發(fā)展趨勢(shì),從智能語(yǔ)音客服到廣告行業(yè)的人聲合成語(yǔ)音,都有著潛在的發(fā)展市場(chǎng)。

但在研發(fā)克隆語(yǔ)音服務(wù)的同時(shí),負(fù)責(zé)技術(shù)開發(fā)的科技公司,應(yīng)更加重視服務(wù)帶來(lái)的用戶隱私和安全問(wèn)題。在智能語(yǔ)音行業(yè),各大科技企業(yè)使該技術(shù)商業(yè)化的同時(shí),需不斷地規(guī)范市場(chǎng)化運(yùn)作,保障用戶權(quán)益。

來(lái)源:Gizmodo