基于H.323協(xié)議的音頻混合方案設計的論文

時間：2023-02-14 02:58:15 其他類論文我要投稿

相關推薦

　　摘要：本文根據(jù)H.323協(xié)議，分析了多點處理單元（MCU）的組成，包括多點控制器（MC）和多點處理器（MP）。并在詳細的分析了音頻多點處理器后，提出了只對滿足條件的m個信道的音頻進行音頻混合的方案，有效的刻服了現(xiàn)在比較流行的平均調(diào)整權重算法的音頻混合方案所產(chǎn)生的缺陷和不足，大大提高了系統(tǒng)對音頻混合的效果。

基于H.323協(xié)議的音頻混合方案設計的論文

　　關鍵詞：H.323協(xié)議；音頻混合；設計

　　近年來，由于網(wǎng)絡技術的快速發(fā)展為IP網(wǎng)絡實現(xiàn)多媒體通信提供了基礎條件，IPTV、視頻會議、多媒體遠程教育等寬帶網(wǎng)絡應用成為熱點。而視頻會議在實用化方面取得了迅速的發(fā)展，功能也己由原先單純的電視會議功能發(fā)展成遠程教學系統(tǒng)、遠程監(jiān)控系統(tǒng)、遠程醫(yī)療系統(tǒng)等多方面的綜合業(yè)務。

　　1、多點控制單元(MCU)

　　H.323協(xié)議在邏輯上可以分為四個組成實體:終端(Terminal)、網(wǎng)關(Gateway)、網(wǎng)守(Gatekeeper)、多點控制單元(MCU)。

　　多點控制單元用于支持三個以上端點設備的會議。在H.323系統(tǒng)中，一個多點控制單元由一個多點控制器(MC)和幾個多點處理器(MP)組成，但也可以不包含MP。多點控制器處理終端間的H.245控制信息，從而決定它對視頻和音頻通常的處理能力。在必要情況下，多點控制器還可以判斷哪些視頻流和音頻流需要多播，以控制會議系統(tǒng)使用的資源。

　　視頻會議中，在集體討論和自由發(fā)言的情況下，可能會有多個與會者同時發(fā)言。為了使每個與會者能同時聽到其他所有發(fā)言者的聲音，采用了音頻混合技術。音頻混合單元從各個終端取得音頻信號，經(jīng)過混合編碼后再發(fā)送到各終端。該技術的引入使得各終端在接收多個發(fā)言人的音頻信號時，在帶寬占用和信號處理方面，與接收單一發(fā)言人的音頻信號相比，不會增加任何額外負擔。

　　為了實現(xiàn)音頻信號混合功能，系統(tǒng)必須具備語音信號編解碼和音頻碼流轉(zhuǎn)換功能。H.323要求所有終端必須支持G.711語音標準，而對G.722，G.728，G.723.1和G.729標準則是可選擇的。對于能夠提供高速帶寬環(huán)境的網(wǎng)絡，為了保證語音的高質(zhì)量，可以采用速率較高的編碼方式，如G.711, G.722;對于遠程接入系統(tǒng)，由于帶寬昂貴，則可以采用碼率較低的編碼方式，如G.723.1。相應地，MCU必須支持以上各種語音編碼標準。

　　音頻混合單元要求輸入的各路語音信息屬于同一種編碼，但實際應用中由于各個終端選用的編碼器可能不同，因而發(fā)往MCU的音頻碼流也可能不同。為了解決這個矛盾，必須在混音之前先進行碼流轉(zhuǎn)換，將不同的碼流轉(zhuǎn)換成同一種編碼，再送入音頻混合處理單元。

　　2、音頻混合方案設計

　　在實際應用中，如果與會人數(shù)只有兩人，則只要保證通信是全雙工的，就可以正常地進行會議，而無須進行混音。如果與會人數(shù)超過3人，則需要采用混音或者轉(zhuǎn)發(fā)機制。

　　轉(zhuǎn)發(fā)機制有兩種策略：其一，將其他端點的數(shù)據(jù)都轉(zhuǎn)發(fā)給一個端點；其二，按照約定的某種規(guī)則選出一路進行轉(zhuǎn)發(fā)，也就是常見的“話筒傳遞”模式。這兩種模式雖然可以滿足一定層面的需求，但都存在明顯的缺陷。前者會增加網(wǎng)絡的傳輸負擔和端點的處理負擔，后者在多人會議的討論中有明顯的反應慢效果差的缺陷。如果與會者希望能夠進行比較頻繁的切換發(fā)言或者討論，則會出現(xiàn)明顯的斷續(xù)和切換失效等情況。

　　而實時混音則能很好地解決這些問題。實際應用中，一般的混音方案都會采用時域疊加作為基本的處理手段。但是根據(jù)前面的分析可知，由于數(shù)字音頻信號存在量化上限和下限的問題，則因疊加運算肯定會造成結果溢出。通常的處理手段是進行溢出檢測，然后再進行飽和運算，即超過上限的結果被置為上限值，超過下限的值置為下限值。這種運算本身破壞了語音信號原有的時域特征，從而引入了噪聲。這就是在某些系統(tǒng)中會出現(xiàn)爆破聲和語音不連續(xù)現(xiàn)象的原因。同時，隨著參與混音的人數(shù)增加，出現(xiàn)溢出的頻率也不斷上升，所以這類方法存在一個上限，而且這個上限值很低，實驗證明，一般在4個終端參與混音時其結果就有很多噪音和斷續(xù)，無法分辨語流了。

　　3、音頻混合方案的改進設計

　　直接將各路音頻流算術相加得到音頻混合信號，其優(yōu)點是簡單且易于實現(xiàn)。經(jīng)測試，在輸入語音流少于4路時，能清晰地分辨各路語音信號。但系統(tǒng)仍存在問題。

　　在前述方法的基礎上稍作改進可得到另一類混音設計方法，即將各路音頻碼流解碼后，先對解碼語音信號作一定程度的衰減，再進行算術相加。一般是在各路語音上乘以一個衰減因子1/n，其中n為進入混音器的語音流數(shù)目。這種方法能絕對保證相加后的語音信號不會溢出，而且對原算法的修改極少，極易實現(xiàn)。但是它存在的關鍵問題是，當進入混音器的語音流數(shù)較多時，各路語音信號的衰減程度都比較大，混音的結果是所有信號都比較弱，無法突出重點，嚴重時可能所有聲音都聽不清楚。

　　實現(xiàn)這一改進策略時，仍然是在每個語音通道上綁定一個解碼器，負責該路語音的解碼，但無需再綁定編碼器。系統(tǒng)中最多同時存在m+l個編碼器，其中m個分配給m路被選中的語音通道，另一個分配給音頻混合信號S，對S編碼后的碼流發(fā)送到所有未被選中的終端和廣播終端。由于解碼器的運算復雜度遠小于編碼器，因此系統(tǒng)的計算負荷大大降低。改進后的混音器只選取音量最大的m路進行混音，其余信號被衰減，合理選擇m的值，不僅使會議發(fā)言重點得以突出，與會者能獲得最重要的發(fā)言信息，而且一般情況下都不會發(fā)生溢出情況。這一改進措施同時解決了前述兩種方法所存在的問題和缺陷。

　　某個編碼器在由一個語音通道轉(zhuǎn)而分配給另一個語音通道時，必須先進行初始化(G.711a/u除外)。必須注意，要盡量減少編碼器和語音通道之間對應關系的改變。

　　4、結束

　　本文在研究了H.323協(xié)議的基礎上，研究了MCU的音頻混合模型，并詳細闡述了音頻混合方案，為了過濾混合時的嘈音和增加臨場感，提出了音頻混合方案的改進方案。

【基于H.323協(xié)議的音頻混合方案設計的論文】相關文章：

利用光纜解決音頻信號傳輸問題的論文04-25

論文課題研究方案設計06-04

基于問題導引的探究式教學研究論文08-03

基于遺忘理論的英語移動學習模型探究的論文05-20

基于單片機監(jiān)控系統(tǒng)的研究畢業(yè)論文06-14

高�；旌鲜浇虒W法探討論文04-21

高職院�；趩栴}模式的高等數(shù)學教學的研究論文05-06

口腔醫(yī)學教育基于問題的學習教學模式論文05-07

淺談基于學習對象理論的教學資源庫研究的論文06-22

基于藝術展覽的公共文化服務體系建設論文04-19

国产激情久久久久影院小草_国产91高跟丝袜_99精品视频99_三级真人片在线观看

基于H.323協(xié)議的音頻混合方案設計的論文