語音識(shí)別芯片的發(fā)展歷史已經(jīng)有很長(zhǎng)了,但是要具體說哪個(gè)更好,這要從不同的維度來評(píng)判,因?yàn)椴煌漠a(chǎn)品對(duì)于語音識(shí)別芯片的需求是不同的,不同的產(chǎn)品的預(yù)算也是不同的,芯片和產(chǎn)品只有匹配度最佳而沒有說哪個(gè)最好的這個(gè)說法。
語音識(shí)別芯片型號(hào)特性一覽
WTK6900 系列:其中,WTK6900G-24SS 是本地語音觸發(fā)引擎的辨識(shí)芯片,具有低成本、高可靠性等特點(diǎn),擁有高性能 32 位 RISC 內(nèi)核,主頻 200MHz,支持浮點(diǎn)運(yùn)算。WTK6900H-24SS 采用神經(jīng)網(wǎng)絡(luò)算法,識(shí)別精準(zhǔn)、誤判率低,5 米遠(yuǎn)場(chǎng)可靠識(shí)別,支持 MP3、WAV 音頻解碼。WTK6900HM01 接口簡(jiǎn)單,支持識(shí)別詞條豐富,可達(dá) 50-300 條且可定制,內(nèi)置降噪算法。
WT2605C:集成雙模藍(lán)牙,陣列麥克風(fēng),支持4G/WIFI鏈接,支持 BLE 低功耗連接,可接入云端實(shí)現(xiàn)復(fù)雜語義交互。升級(jí)后支持全球 51 國(guó)語言及 22 種國(guó)內(nèi)方言,信噪比達(dá) 95dB,支持流媒體播放與遠(yuǎn)程控制,適用于跨境智能設(shè)備和可穿戴設(shè)備等。
AM5728:由德州儀器公司推出,采用雙 ARM Cortex-A15 內(nèi)核和兩個(gè) 4 通道的超大讀寫數(shù)據(jù)存儲(chǔ)器,集成了多個(gè)音頻和視頻接口,支持各類標(biāo)準(zhǔn)和主流的操作系統(tǒng),具有多種實(shí)時(shí)通信接口,在語音識(shí)別領(lǐng)域性能卓越。
MT8516:是聯(lián)發(fā)科技公司推出的語音智能處理器芯片,采用四核 ARM Cortex-A35 處理器,最高時(shí)鐘速度可達(dá) 1.3GHz,內(nèi)置 2GB LPDDR3 與 8GB eMMC 存儲(chǔ)器,支持 H.264 編碼處理,特別適用于入門級(jí) AI 語音設(shè)備,且與 Alexa Voice Service 系統(tǒng)兼容。
其實(shí)通過以上幾個(gè)經(jīng)典語音識(shí)別的型號(hào)對(duì)比,你可以發(fā)現(xiàn)語音識(shí)別芯片有兩極分化,一部分端側(cè)能力很強(qiáng),主打高性能,但是成本也很高只適合做一些高端產(chǎn)品,還有一部分端側(cè)能力沒有那么強(qiáng)只能滿足一些基本指令,但是價(jià)格實(shí)惠,普遍適合搭載常規(guī)的設(shè)備上。
這其實(shí)是市場(chǎng)選擇的結(jié)果,語音識(shí)別目前就是本地+云端的方式,本地算力強(qiáng)模型強(qiáng),那么本地的效果就堪比在線的效果連不聯(lián)網(wǎng)都無所謂,但是很重要的一點(diǎn)是這種方式的成本就飆升。反之本地的算力差一些但是可以完成識(shí)別功能轉(zhuǎn)換成文字以后和云端大模型交流后再返回到本地通過語音播報(bào)功能來實(shí)現(xiàn)對(duì)話。
語音識(shí)別芯片選型是可以根據(jù)自己產(chǎn)品的定位和需求來進(jìn)行的 ,目前市場(chǎng)上有比較豐富的產(chǎn)品型號(hào)可以選擇,以WTK6900系列為例,這款芯片可以支持自定義指令,多個(gè)版本分別支持本都10-300條的命令詞,聯(lián)網(wǎng)狀態(tài)下命令詞就無限了。WT2606則是可以做到連續(xù)多輪語音對(duì)話。
以上“語音識(shí)別芯片哪個(gè)最好?”的說明,希望可以幫助到大家,產(chǎn)品適配語音芯片沒有最好,只有最合適,合適的預(yù)算配上合適的芯片,那就是一個(gè)合適的產(chǎn)品。
Copyright (?) 2020 深圳唯創(chuàng)知音電子有限公司 版權(quán)所有 地址:深圳市寶安區(qū)福永街道大洋路90號(hào)中糧福安機(jī)器人智造產(chǎn)業(yè)園6棟2/3層 備案號(hào):粵ICP備15026214號(hào)