麥可興陣列麥克風(fēng)硅麥原理

文章出處：青興偉業(yè)網(wǎng)絡(luò)編輯部發(fā)表時(shí)間：2020-05-19 18:30

一、麥克風(fēng)陣列技術(shù)
學(xué)術(shù)上有個(gè)概念是“傳聲器陣列”，主要由一定數(shù)目的聲學(xué)傳感器組成，用來對(duì)聲場的空間特性進(jìn)行采樣并處理的系統(tǒng)。而這篇文章講到的麥克風(fēng)陣列是其中一個(gè)狹義概念，特指應(yīng)用于語音處理的按一定規(guī)則排列的多個(gè)麥克風(fēng)系統(tǒng)，也可以簡單理解為2個(gè)以上麥克風(fēng)組成的錄音系統(tǒng)。

二、麥克風(fēng)陣列需求
消費(fèi)級(jí)麥克風(fēng)陣列的興起得益于語音交互的市場火熱，主要解決遠(yuǎn)距離語音識(shí)別的問題，以保證真實(shí)場景下的語音識(shí)別率。這涉及了語音交互用戶場景的變化，當(dāng)用戶從手機(jī)切換到類似Echo智能音箱或者機(jī)器人的時(shí)候，實(shí)際上麥克風(fēng)面臨的環(huán)境就完全變了，這就如同兩個(gè)人竊竊私語和大聲嘶喊的區(qū)別。

　　前幾年，語音交互應(yīng)用最為普遍的就是以Siri為代表的智能手機(jī)，這個(gè)場景一般都是采用單麥克風(fēng)系統(tǒng)。單麥克風(fēng)系統(tǒng)可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識(shí)別需求的聲音信號(hào)。但是，若聲源距離麥克風(fēng)距離較遠(yuǎn)，并且真實(shí)環(huán)境存在大量的噪聲、多徑反射和混響，導(dǎo)致拾取信號(hào)的質(zhì)量下降，這會(huì)嚴(yán)重影響語音識(shí)別率。而且，單麥克風(fēng)接收的信號(hào)，是由多個(gè)聲源和環(huán)境噪聲疊加的，很難實(shí)現(xiàn)各個(gè)聲源的分離。這樣就無法實(shí)現(xiàn)聲源定位和分離，這很重要，因?yàn)檫€有一類聲音的疊加并非噪聲，但是在語音識(shí)別中也要抑制，就是人聲的干擾，語音識(shí)別顯然不能同時(shí)識(shí)別兩個(gè)以上的聲音。

　　顯然，當(dāng)語音交互的場景過渡到以Echo、機(jī)器人或者汽車為主要場景的時(shí)候，單麥克風(fēng)的局限就凸顯出來。為了解決單麥克風(fēng)的這些局限性，利用麥克風(fēng)陣列進(jìn)行語音處理的方法應(yīng)時(shí)而生。麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)（常用線形、環(huán)形）擺放的麥克風(fēng)組成，對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理，實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能，進(jìn)而提高語音信號(hào)處理質(zhì)量，以提高真實(shí)環(huán)境下的語音識(shí)別率。

三、麥克風(fēng)關(guān)鍵技術(shù)
消費(fèi)級(jí)的麥克風(fēng)陣列主要面臨環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、陣列結(jié)構(gòu)等問題，若使用到語音識(shí)別場景，還要考慮針對(duì)語音識(shí)別的優(yōu)化和匹配等問題。為了解決上述問題，特別是在消費(fèi)領(lǐng)域的垂直場景應(yīng)用環(huán)境中，關(guān)鍵技術(shù)就顯得尤為重要。

　　噪聲抑制：語音識(shí)別倒不需要完全去除噪聲，相對(duì)來說通話系統(tǒng)中需要的技術(shù)則是噪聲去除。這里說的噪聲一般指環(huán)境噪聲，比如空調(diào)噪聲，這類噪聲通常不具有空間指向性，能量也不是特別大，不會(huì)掩蓋正常的語音，只是影響了語音的清晰度和可懂度。這種方法不適合強(qiáng)噪聲環(huán)境下的處理，但是應(yīng)付日常場景的語音交互足夠了。

　　混響消除：混響在語音識(shí)別中是個(gè)蠻討厭的因素，混響去除的效果很大程度影響了語音識(shí)別的效果。我們知道，當(dāng)聲源停止發(fā)聲后，聲波在房間內(nèi)要經(jīng)過多次反射和吸收，似乎若干個(gè)聲波混合持續(xù)一段時(shí)間，這種現(xiàn)象叫做混響?；祉憰?huì)嚴(yán)重影響語音信號(hào)處理，比如互相關(guān)函數(shù)或者波束主瓣，降低測(cè)向精度。

回聲抵消：嚴(yán)格來說，這里不應(yīng)該叫回聲，應(yīng)該叫“自噪聲”。回聲是混響的延伸概念，這兩者的區(qū)別就是回聲的時(shí)延更長。一般來說，超過100毫秒時(shí)延的混響，人類能夠明顯區(qū)分出，似乎一個(gè)聲音同時(shí)出現(xiàn)了兩次，我們就叫做回聲，比如天壇著名的回聲壁。實(shí)際上，這里所指的是語音交互設(shè)備自己發(fā)出的聲音，比如Echo音箱，當(dāng)播放歌曲的時(shí)候若叫Alexa，這時(shí)候麥克風(fēng)陣列實(shí)際上采集了正在播放的音樂和用戶所叫的Alexa聲音，顯然語音識(shí)別無法識(shí)別這兩類聲音?；芈暤窒褪且サ羝渲械囊魳沸畔⒍槐Ａ粲脩舻娜寺?，之所以叫回聲抵消，只是延續(xù)大家的習(xí)慣而已，其實(shí)是不恰當(dāng)?shù)摹?/p>

　　聲源測(cè)向：這里沒有用聲源定位，測(cè)向和定位是不太一樣的，而消費(fèi)級(jí)麥克風(fēng)陣列做到測(cè)向就可以了，沒必要在這方面投入太多成本。聲源測(cè)向的主要作用就是偵測(cè)到與之對(duì)話人類的聲音以便后續(xù)的波束形成。聲源測(cè)向可以基于能量方法，也可以基于譜估計(jì)，陣列也常用TDOA技術(shù)。聲源測(cè)向一般在語音喚醒階段實(shí)現(xiàn)，VAD技術(shù)其實(shí)就可以包含到這個(gè)范疇，也是未來功耗降低的關(guān)鍵研究內(nèi)容。

　　波束形成：波束形成是通用的信號(hào)處理方法，這里是指將一定幾何結(jié)構(gòu)排列的麥克風(fēng)陣列的各麥克風(fēng)輸出信號(hào)經(jīng)過處理（例如加權(quán)、時(shí)延、求和等）形成空間指向性的方法。波束形成主要是抑制主瓣以外的聲音干擾，這里也包括人聲，比如幾個(gè)人圍繞Echo談話的時(shí)候，Echo只會(huì)識(shí)別其中一個(gè)人的聲音。

　　陣列增益：這個(gè)比較容易理解，主要是解決拾音距離的問題，若信號(hào)較小，語音識(shí)別同樣不能保證，通過陣列處理可以適當(dāng)加大語音信號(hào)的能量。

　　模型匹配：這個(gè)主要是和語音識(shí)別以及語義理解進(jìn)行匹配，語音交互是一個(gè)完整的信號(hào)鏈，從麥克風(fēng)陣列開始的語音流不可能割裂的存在，必然需要模型匹配在一起。實(shí)際上，效果較好的語音交互專用麥克風(fēng)陣列，通常是兩套算法，一套內(nèi)嵌于硬件實(shí)時(shí)處理，另外一套服務(wù)于云端匹配語音處理。

四、青興適合運(yùn)用陣列硅麥的型號(hào)推薦---高靈敏度、高信噪比硅麥
QX-4737數(shù)字硅麥 -26DBFS SNR59 PDM輸出
QX-3526數(shù)字硅麥 -26DBFS SNR65 PDM輸出
QX-4030數(shù)字硅麥 -26DBFS SNR64 PDM輸出

下一篇：耳機(jī)被動(dòng)降噪硅麥與主動(dòng)數(shù)字咪頭原理區(qū)別是什上一篇：安防攝像機(jī)咪頭降噪麥克風(fēng)如何選用？

久久这里精品国产99丫E6,人人看欧美中文日韩国产,A∨无码天堂AV免费播放观看在线,国产麻豆一区日韩欧美

專注咪頭（麥克風(fēng)）生產(chǎn)批發(fā)12年

麥可興陣列麥克風(fēng)硅麥原理

推薦產(chǎn)品

同類文章排行

最新資訊文章