華爾思科技AI語(yǔ)音算法全面升級(jí),喚醒詞更改為:小智小智,誤喚醒率降低90%以上。
發(fā)布時(shí)間:2023-10-17 13:22:26 瀏覽:7738次
2023年初,華爾思與思必馳深度合作,進(jìn)行AI語(yǔ)音算法的深度定制與適配,歷經(jīng)近9個(gè)月的軟硬件聲學(xué)調(diào)整,華爾思全系列產(chǎn)品全面提升語(yǔ)控的算法能力,使得在現(xiàn)在公版的方案上,喚醒率從90%提升到98%,誤喚醒率則降低了90%以上。喚醒詞由原來(lái)的“你好小智”更改為“小智小智”。

眾所周知,現(xiàn)在行業(yè)中幾乎都是沒(méi)有進(jìn)行過(guò)聲學(xué)適配的公版AI語(yǔ)音方案。高靈敏喚醒時(shí),容易觸發(fā)更多的誤喚醒。用戶在聊天或者看電視的時(shí)候,就常常遇到旁邊的智能突然被喚醒,被“插話”,讓用戶不勝其煩。很多客戶都是關(guān)閉語(yǔ)音,語(yǔ)音功能就變成了擺設(shè)。
此前,行業(yè)大部分產(chǎn)品能達(dá)到24小時(shí)的誤喚醒率2-10次已經(jīng)算是不錯(cuò)的水平。有些產(chǎn)品更是達(dá)到24小時(shí)數(shù)十次,甚至更高,華爾思產(chǎn)品經(jīng)過(guò)思必馳最新的技術(shù)深度優(yōu)化,定制與硬件匹配的聲學(xué)模型, 經(jīng)1000h+實(shí)測(cè),噪雜環(huán)境測(cè)試,每168小時(shí)誤喚醒僅一次,在維持超高喚醒率的同時(shí),誤喚醒率相對(duì)降低90%以上。

華爾思產(chǎn)品搭載了思必馳雙麥或四麥陣列前端信號(hào)處理算法,語(yǔ)音喚醒、語(yǔ)音合成、語(yǔ)音識(shí)別、智能降噪等語(yǔ)音語(yǔ)言新技術(shù)。定制了專屬的聲學(xué)模型,大大提升產(chǎn)品的AI語(yǔ)音能力,讓語(yǔ)控更絲滑。
華爾思定制的AI語(yǔ)音聲學(xué)模型基于思必馳人工智能技術(shù),主要包括語(yǔ)音識(shí)別、語(yǔ)音合成和語(yǔ)音評(píng)測(cè)三個(gè)部分。

定制專屬AI語(yǔ)音識(shí)別是將語(yǔ)音轉(zhuǎn)換為文本的過(guò)程有更高的識(shí)別度,主要使用了專有聲學(xué)模型、專有語(yǔ)言模型和搜索算法。首先,專有聲學(xué)模型會(huì)將輸入的語(yǔ)音信號(hào)映射到對(duì)應(yīng)的音素上;然后,語(yǔ)言模型會(huì)利用文本上下文來(lái)找到最有可能的文本輸出結(jié)果;最后,搜索算法會(huì)選擇最優(yōu)的文本結(jié)果輸出。
定制的AI語(yǔ)音合成是將文本轉(zhuǎn)換為語(yǔ)音的過(guò)程,主要采用了基于規(guī)則、基于統(tǒng)計(jì)和基于深度學(xué)習(xí)的方法。其中,基于深度學(xué)習(xí)的語(yǔ)音合成,可以通過(guò)對(duì)大量的真人語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,生成非常自然的語(yǔ)音。這種方法讓整個(gè)語(yǔ)音的鏈路更加通順。這樣使得華爾思產(chǎn)品,語(yǔ)音識(shí)別度更高,語(yǔ)音喚醒率更高,語(yǔ)音誤喚醒率更低,大大提升AI語(yǔ)音識(shí)別的體驗(yàn)感。
寧波華爾思電子科技有限公司


寧波華爾思電子科技有限公司