技術(shù)
導(dǎo)讀:針對(duì)在全屋智能一體化家居場(chǎng)景或賣場(chǎng)場(chǎng)景下多設(shè)備的情況,思必馳新推出“直面喚醒”方案,可以幫助用戶優(yōu)先喚醒其中某一個(gè)設(shè)備,避免幾個(gè)設(shè)備同時(shí)被喚醒。
在5G、物聯(lián)網(wǎng)以及互聯(lián)網(wǎng)家裝等因素作用下,智能家居市場(chǎng)已經(jīng)展現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。著眼日常生活,家電賣場(chǎng)琳瑯滿目皆是搭載智能語音的電器家電,一個(gè)家庭中或多或少都會(huì)有幾款智能設(shè)備。
應(yīng)用火熱的背后,同一場(chǎng)景下多款智能設(shè)備如何實(shí)現(xiàn)優(yōu)先喚醒變成了一個(gè)問題。當(dāng)智能音箱、電視、空調(diào)等共用一個(gè)喚醒詞時(shí),多臺(tái)智能設(shè)備可能會(huì)同時(shí)被喚醒,產(chǎn)生“一呼百應(yīng)”的現(xiàn)象。為解決此類問題,思必馳最新推出基于多設(shè)備選擇算法的直面喚醒方案,判斷更精準(zhǔn)、更符合用戶的交互習(xí)慣。
直面喚醒,拒絕“一呼百應(yīng)”
針對(duì)在全屋智能一體化家居場(chǎng)景或賣場(chǎng)場(chǎng)景下多設(shè)備的情況,思必馳新推出“直面喚醒”方案,可以幫助用戶優(yōu)先喚醒其中某一個(gè)設(shè)備,避免幾個(gè)設(shè)備同時(shí)被喚醒。
“直面喚醒”依據(jù)設(shè)備麥克風(fēng)數(shù)據(jù),多維度參考信噪比,喚醒置信度、混響時(shí)間、頻響分布特征、聲源定位等信息,通過計(jì)算指向性空間統(tǒng)計(jì)量反映設(shè)備自身參數(shù)指標(biāo)。當(dāng)多臺(tái)相同喚醒詞的設(shè)備在同一家居環(huán)境下連接到同一局域網(wǎng)內(nèi),憑借分布式組網(wǎng)策略下的設(shè)備間通信,基于所有設(shè)備的指標(biāo)選取出最佳的唯一設(shè)備進(jìn)行響應(yīng),其余設(shè)備保持靜默。
依照“優(yōu)先朝向,結(jié)合距離”的原則,我們從兩個(gè)簡(jiǎn)化示例了解“直面喚醒”應(yīng)用場(chǎng)景的工作原理。
圖一
距離相近,依據(jù)朝向:圖一中,人聲到設(shè)備A、B的距離接近,A、B設(shè)備麥克風(fēng)均朝向中間聲源位置,形成90度角,此時(shí)面向A設(shè)備呼喊喚醒詞則喚醒A,面向B即喚醒B。
圖二
朝向相近,距離優(yōu)先:圖二中,人聲到設(shè)備A的距離和設(shè)備A到B的距離基本相等,設(shè)備A在前,B在后。設(shè)備A、B麥克風(fēng)均朝向聲源位置,且兩設(shè)備均在相近朝向角度上。此時(shí)在距離A前方一定范圍內(nèi)任意呼喊喚醒詞時(shí),均為A設(shè)備喚醒。
多設(shè)備選擇算法,精準(zhǔn)定位
VR游戲中,我們發(fā)現(xiàn)3D音效可以使人感受到聲音的遠(yuǎn)近和方位;演員用抖動(dòng)耳朵來表現(xiàn)分辨聲源......人類的神經(jīng)系統(tǒng)通過對(duì)比同一個(gè)聲源到達(dá)兩耳之間的時(shí)間差以及強(qiáng)度差,判斷出聲源的位置。
“直面喚醒”多設(shè)備選擇算法優(yōu)勢(shì)之一,就是模擬人耳的算法模型。在提升準(zhǔn)確率的同時(shí),有效保障不同環(huán)境不同設(shè)備以及不同環(huán)境差異下的算法魯棒性,惡劣環(huán)境下(如人聲朝向設(shè)備距離稍遠(yuǎn)于就近非朝向設(shè)備或空間混響大噪聲強(qiáng)時(shí))依舊可以達(dá)到較好效果。
優(yōu)勢(shì)二即模擬真人使用習(xí)慣,“優(yōu)先朝向,結(jié)合距離”選擇被喚醒的設(shè)備。多個(gè)將要被喚醒的設(shè)備在距離相近情況下,算法依據(jù)發(fā)音朝向判斷;在朝向相同情況下,則依據(jù)距離差異判斷“就近喚醒”,做到精確、優(yōu)先喚醒。
另外,多設(shè)備選擇算法支持雙麥、四麥、六麥,線性/環(huán)形麥克風(fēng)陣列,依靠設(shè)備麥克風(fēng)數(shù)據(jù),多維度參考直達(dá)聲、混響能量、頻響特征、聲源定位等信息,計(jì)算出設(shè)備自身參數(shù)指標(biāo),多設(shè)備比較后選出最優(yōu)設(shè)備。
分布式組網(wǎng),唯一喚醒
直面喚醒自然的語音交互體驗(yàn),除了依托多設(shè)備選擇算法的技術(shù)優(yōu)勢(shì)外,還得益于分布式組網(wǎng)策略的加持。
在智能家居應(yīng)用中,不同智能設(shè)備使用不同操作系統(tǒng)、通信協(xié)議和標(biāo)準(zhǔn)的現(xiàn)狀導(dǎo)致用戶體驗(yàn)相對(duì)割裂。在同一家居空間內(nèi)存在有多臺(tái)相同喚醒詞的設(shè)備連接到同一局域網(wǎng)內(nèi)時(shí)、打開“直面喚醒”功能,用戶發(fā)出喚醒指令后,觸發(fā)喚醒設(shè)備間借助無線局域網(wǎng)進(jìn)行快速通信,選取出最佳的唯一設(shè)備進(jìn)行響應(yīng),其余設(shè)備保持靜默。
例如用戶發(fā)出“小馳,小馳”喚醒詞后,直面喚醒在分布式組網(wǎng)支撐下,可以精確定位指令發(fā)出的位置,且只會(huì)有最佳位置的一個(gè)設(shè)備響應(yīng)用戶需求,消除用戶一次喚醒所有同喚醒詞設(shè)備的尷尬。
除此之外,“分布式組網(wǎng)策略”還加入防抖機(jī)制,避免喚醒聲間隔太近產(chǎn)生干擾;跨系統(tǒng)平臺(tái)支持常用Android、Linux、RTOS操作系統(tǒng)進(jìn)行多維度互聯(lián),網(wǎng)絡(luò)變化時(shí)快速響應(yīng),通斷自如;正常網(wǎng)絡(luò)和設(shè)備性能下,唯一喚醒成功率達(dá)到99%。
萬物智聯(lián)時(shí)代,家居場(chǎng)景構(gòu)建開啟加速模式。思必馳在源頭創(chuàng)新技術(shù)上堅(jiān)持產(chǎn)學(xué)研一體化。借助全屋智能風(fēng)起之勢(shì),思必馳將同各大終端廠商攜手推進(jìn)產(chǎn)品升級(jí),為用戶創(chuàng)造更便捷、更智能的交互體驗(yàn)。