- 相關(guān)推薦
如何運用RSC-3x開發(fā)出高性能的語音識別產(chǎn)品
摘要:本文給出了在運用RSC-3x設(shè)計高性能的語音識別產(chǎn)品時應考慮的與硬件有關(guān)的若干問題:噪音降除、電路設(shè)計、PCB設(shè)計、麥克風的選擇、麥克風的安放、電源設(shè)計。關(guān)鍵詞: RSC-3x, 識別率,噪音降除,電路設(shè)計,PCB設(shè)計,麥克風,電源
RSC-3x是美國Sensory公司出品的交互式語音產(chǎn)品。它同RSC其他系列的產(chǎn)品一樣運用神經(jīng)元算法實現(xiàn)了語音識別的功能,在理想環(huán)境下,其識別率可達97%以上。并具有語音合成、錄音回放、四聲道音樂合成等語音處理功能。由于內(nèi)含一個8位處理器,RSC-3x還可實現(xiàn)通用處理器的系統(tǒng)控制功能。RSC-3x的高性能和適中的價格使得它主要應用在消費類電子產(chǎn)品和價格敏感的家電產(chǎn)品上。
但是,如何才能運用RSC-3x系列產(chǎn)品開發(fā)出性能良好的語音識別產(chǎn)品呢?本文給出了在設(shè)計語音識別產(chǎn)品時應在硬件方面考慮的若干問題。
一、噪音降除
語音識別的準確率(簡稱識別率)會受到諸多因素的干擾而下降。一個導致識別率下降最常見的因素就是噪音:來自系統(tǒng)內(nèi)部的電子噪音和麥克風所拾取的聲頻噪音。RSC-3x的一個主要革新技術(shù)就是在其片內(nèi)加入了一個聲頻預放電路。來自典型的駐極體麥克風的電壓信號只是毫伏級的,而能被RSC-3x使用的整個預放增益信號卻要放大到200倍以上。通過RSC-3x內(nèi)置的預放電路,只需外加少許的幾個被動元器件就可以達到這個放大作用。良好的接地措施和消除模擬電路中的交叉干擾會進一步確保良好的識別率。鼓勵用戶大聲說話和接近麥克風可以輔助獲得良好的信噪比。
二、電路設(shè)計
圖一是RSC-3x聲頻預放部分的參考電路。阻值為1.5K的麥克風電阻(Rx)對系統(tǒng)增益具有很大的影響,因此應根據(jù)麥克風的敏感度來決定其值的大小。圖中的1.5K是典型值。
下表所列為Rx和Cx的推薦值:
Rx
Cx
1K
[1] [2] [3]
【如何運用RSC-3x開發(fā)出高性能的語音識別產(chǎn)品】相關(guān)文章:
反饋法在英語語音教學中的運用05-02
如何識別非法期刊04-29
夏日如何識別毒西瓜?05-01
如何識別并培植核心能力05-02
如何識別并防范求職陷阱03-20
納稅證明如何開04-29
如何開失業(yè)證明04-29