應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

一鍵網(wǎng)頁轉(zhuǎn)視頻!谷歌又推出了什么AI新科技?

2020-11-02 14:23 智東西

導(dǎo)讀:如果我們看向這神奇功能背后的原理,就會發(fā)現(xiàn)視頻轉(zhuǎn)化技術(shù)離不開對網(wǎng)頁元素的分類和排序。

谷歌表示正在開發(fā)一種可以自動將網(wǎng)頁轉(zhuǎn)換為短視頻的AI系統(tǒng)URL2Video。該系統(tǒng)可以自動從HTML中提取諸如文本、圖片以及字體、顏色和布局等設(shè)計模板,并將這些元素組成與原網(wǎng)頁外觀相似的視頻。

該系統(tǒng)主要針對那些對自身產(chǎn)品和服務(wù)已經(jīng)有詳盡的網(wǎng)頁介紹,但還未有視頻介紹的公司。

谷歌表示,通過URL2Video處理網(wǎng)頁信息,就可使產(chǎn)品和服務(wù)以視頻形式觸達(dá)更多的受眾。而且相比起傳統(tǒng)視頻制作需要數(shù)天到數(shù)周的制作周期、880到1200美元的制作成本,URL2Video有著難以比擬的優(yōu)勢。

基于與專業(yè)剪輯師的討論,URL2Video采用了一種啟發(fā)式方法來確定視頻編輯模版,包括內(nèi)容層次、視頻信息量及其每種元素的持續(xù)時間。URL2Video使用這種方式來解析網(wǎng)頁、分析內(nèi)容、挑選關(guān)鍵文本或圖像、保留相似的設(shè)計風(fēng)格,并根據(jù)用戶的具體要進(jìn)行修改。

如果我們看向這神奇功能背后的原理,就會發(fā)現(xiàn)視頻轉(zhuǎn)化技術(shù)離不開對網(wǎng)頁元素的分類和排序。

URL2Video會在每個網(wǎng)頁中提取文檔對象模型信息和多媒體資料,將視覺上可區(qū)分的內(nèi)容標(biāo)記為視頻中的可用元素,包括標(biāo)題、產(chǎn)品圖片、文字說明和外鏈等。

URL2Video提取的每個元素(即文本和多媒體文件)和網(wǎng)頁相關(guān)信息(HTML標(biāo)簽、CSS樣式等)都會根據(jù)其在原網(wǎng)頁上的重要性進(jìn)行排名和注釋,以獲得不同的優(yōu)先級,例如在網(wǎng)頁頂部占據(jù)較大區(qū)域的元素會得到更高的分?jǐn)?shù)和優(yōu)先級。

基于上述的元素排名方面以及啟發(fā)式視頻編輯模版,URL2Video可以得出視頻中每個元素最佳的停留時間和位置分布。

網(wǎng)頁轉(zhuǎn)視頻的最后一步就是格式調(diào)整,URL2Video會將圖片的大小轉(zhuǎn)換成適合視頻畫面的長寬比,根據(jù)風(fēng)格和主題確定視頻中采用的字體和配色,再轉(zhuǎn)化為MPEG-4格式。

為了使視頻簡潔,URL2Video僅顯示網(wǎng)頁中的主要元素,如標(biāo)題和主產(chǎn)品圖,并會限制每個元素在視頻中停留的時間。

谷歌表示在用戶研究和測試中,URL2Video已經(jīng)做到了從網(wǎng)頁中高效地提取元素,并通過交互功能鍵來輔助用戶剪輯。

谷歌科學(xué)家Peggy Chi和Irfan Essa在博客中寫道:“盡管當(dāng)前的研究重點是視覺展現(xiàn),但我們正在研究視頻編輯中的音軌和畫外音等技術(shù)??偠灾覀兿嘈疟憬莸囊曨l剪輯是大勢所趨,而機(jī)器學(xué)習(xí)模型可以以交互的形式給剪輯師布局排版的建議,以快速創(chuàng)造多個高質(zhì)量視頻?!?/p>

來源:VentureBeat