- 相關(guān)推薦
淺談面向公共信息傳播的音頻水印算法
摘要:提出了一種基于小波分解和倒譜技術(shù)的音頻數(shù)字水印算法,該算法通過對原始音頻進行小波多級分解,從中選取低頻系數(shù)進行倒譜變換。通過統(tǒng)計均值的計算和調(diào)整方法設(shè)計,完成了水印的嵌入。實驗結(jié)果表明該算法能夠有效地抵抗A/D和D/A攻擊,誤碼率為O,隱藏容量較大。同時,本算法還能夠抵抗一定的AMR攻擊,為手機音頻的安全傳播和管理提供了新的前景。
關(guān)鍵詞:音頻水印;小波變換;倒譜;模/數(shù)轉(zhuǎn)換;AMR格式
0、引言
在電視廣播、交通臺和音樂會等公共信息傳播領(lǐng)域,音頻的版權(quán)管理和安全傳輸都非常重要。如果采用數(shù)字水印技術(shù),則需要水印算法能夠抵抗A/D和D/A轉(zhuǎn)換。目前,具有這種變換的類型可以劃分為三種。第種是基于電纜傳輸方式,以電話線傳播和直通電纜連接為典型,所受干擾小。電話線方式是公用信道,能夠傳播很遠,傳輸秘密水印的載體可以是話音或音樂等類型;而直通電纜方式一般在一個辦公實驗的局部環(huán)境中。第二種是基于廣播方式,通過廣播媒體或?qū)S妙l道進行傳播。第三種是基于空氣直接傳播方式,會遭遇各種干擾,通常只能近距離設(shè)計。由于音頻水印的遠程傳輸和提取具有廣泛的應(yīng)用價值,這些音頻傳播水印技術(shù)在國外已經(jīng)受到了極大重視并有所成果。在空氣傳播水印信息方面,德國的steinebach等人…開展了最早的研究,通過設(shè)定5—4oocm的多個不同間距,同時使用了4種不同的麥克風(fēng),研究了5種音頻類型的水印技術(shù),在5~180cm的間距普遍獲得了良好的提取效果。隨后,日本的achibana等人口研究將水印實時地隱藏到公共環(huán)境如音樂演奏會的音樂之中,能夠成功地在一個30s音樂片段內(nèi)隱藏64b的消息,測試的空氣傳播距離為3m。在電話網(wǎng)絡(luò)傳播方面,加拿大的chen等人開展了模擬電話通道的隱藏,在誤碼率小于0.001時,其數(shù)據(jù)帶寬達到了265bps。日本的Modegi等人設(shè)計了一套非接觸水印提取方案,通過手機來廣播或轉(zhuǎn)存水印音頻,然后,通過計算機將秘密從轉(zhuǎn)存的音頻文件提取出來。隱藏帶寬達到61.5bps,提取率高于90%。但是,這幾種研究結(jié)果并沒有對算法做詳細(xì)描述。在直通電纜傳播方面,項世軍等人采用了三段能量比值方法,嵌人的是一串32b信息,雖然提取效果比較好,但由于實驗容量太小,實用性不夠,且對同步技術(shù)有較高的要求;王讓定等人采用改進的量化方法、馬冀平等人”采用了DCT方法,嵌入的都是小圖片,但提取效果一般,僅可辨認(rèn)。雷贄等人在短波廣播含水印音頻算法方面取得了可喜的進展,通過多種同步方案和算法設(shè)計,使水印提取的模擬和實測過程都達到了較好的效果,但實驗容量很小。此外,由守杰等人設(shè)計了一種相似度計算方法,由于是非盲提取,不適于廣播通信領(lǐng)域。作者利用小分段的直方圖特性,開展了抗A/D轉(zhuǎn)換的音頻水印初步研究,在每段開頭總能獲得正確提取,但在每段的后續(xù)隱藏效果不佳,還需要做許多改進。
可見,在面向公共音頻傳播方面,如何既能提高隱藏效果又能增大容量,仍然是音頻水印算法要解決的一個難題。本文通過數(shù)據(jù)特性分析,采用倒譜技術(shù)和小波分解方法,成功地解決了問題,且能夠抵抗一定的手機彩鈴AMR攻擊,為實用化提供了重要基礎(chǔ)。
1、數(shù)據(jù)特性描述
音頻信號經(jīng)過具有A/D和D/A轉(zhuǎn)換的傳輸過程時,必然要涉及到以下問題:
1)音頻信號要經(jīng)歷傳輸過程中的外加干擾,包括50Hz的工頻電信號,因此,需要選擇大于50Hz的音頻頻率信號;
2)因聲卡特性不同,音頻轉(zhuǎn)換過程不一定具有線性模型;
3)傳輸中錄制的音量往往與播放的音量不一致,這要求水印算法能夠抵抗音量的大范圍變化;
4)傳輸中錄制開始時刻可能早于也可能晚于播放時刻而且結(jié)束時刻也不一定一致,所以水印隱藏的起始位置需要沒置標(biāo)志;
5)轉(zhuǎn)換過程具有一定的濾波特點,可濾除較高頻率信號。
1.1音頻頻率范圍選擇
對照音頻頻率響應(yīng)特性圖可以發(fā)現(xiàn),在低頻部分的閾值比2kHz~4kHz的要高得多,不容易察覺;尤其是1kHz以下部分,其不可感知性要好得多。文獻的實驗也表明,音頻數(shù)據(jù)通過A/D和D/A轉(zhuǎn)換后,其低頻范圍700Hz以下的損失非常小。可見,選擇在頻率為(50,700)范圍內(nèi)的音頻數(shù)據(jù),用于信息隱藏非常有利。
1.2倒譜系數(shù)的選取方法
倒譜變換在音頻水印中已經(jīng)具有了較強的健壯性,能夠抵抗噪聲、重采樣、低通濾波、重量化和音頻格式轉(zhuǎn)換等常見攻擊。倒譜變換后的數(shù)據(jù)特征表現(xiàn)為:倒譜系數(shù)在中間部分的差異很小,而在兩端的變化很大。
圖1是對音頻進行7級小波分解后,選取5~7級高頻數(shù)據(jù)部分進行倒譜變換情形。在進行統(tǒng)計處理時,如果讓全部數(shù)據(jù)參與,則計算結(jié)果在隱藏前后有明顯變化;如果不考慮兩側(cè)若干個大數(shù)據(jù),僅以中間大部分?jǐn)?shù)據(jù)參與運算,則計算結(jié)果容易保持在一個穩(wěn)定范圍內(nèi)。
進一步,如果將計算的均值移除,即相當(dāng)于此時的均值為0。然后,在0的上下兩邊產(chǎn)生一個偏差,如2,以分別隱藏比特信息“1”和“0”。則在提取時,只需要判斷所求均值是否大于0,就可以求得水印比特。這種方法,稱之為“數(shù)據(jù)分離調(diào)整”技術(shù)。
2、算法分析與設(shè)計
2.1隱藏算法流程設(shè)計
將原始音頻分段時,段數(shù)至少是水印比特數(shù)。然后,對每段數(shù)據(jù)進行小波分解,取其低頻系數(shù)進行倒譜變換,采用前述的數(shù)據(jù)分離調(diào)整技術(shù),以實現(xiàn)水印比特嵌入。之后,先后重組倒譜系數(shù)和小波系數(shù),獲得含有水印信息的音頻段,從而構(gòu)造為新的音頻。該算法流程如圖2所示。
為了增強可靠性,對水印信息先做糾錯處理,采用BCH編碼方法。算法的主要工作是尋找合理的參數(shù)優(yōu)化配置,使隱藏效果達到最優(yōu)。參數(shù)主要有:小波分解級數(shù)、分段的數(shù)據(jù)幀長度、數(shù)據(jù)幀的間距、上下分離的閾值將數(shù)據(jù)幀的間距設(shè)置為數(shù)據(jù)幀長度的倍數(shù),最大為1,最小為0。期間選擇多個系數(shù),結(jié)果發(fā)現(xiàn)都可以成功實現(xiàn)隱藏。
2.2水印嵌入算法設(shè)計
1)水印信息處理。
音頻載體分段數(shù)至少應(yīng)該大于,才能滿足隱藏要求。
假設(shè)每段長為,該段經(jīng)過小波變換的級分解后,各級小波系數(shù)長度分別為:
取低頻系數(shù)部分,使之頻率范圍位于(50,l000)內(nèi),則需要構(gòu)造一個組合的低頻小波系數(shù)集合。以8kHz音頻為例,實施7級小波分解后,所選擇的低頻系數(shù)部分為:
P的長度非常重要。如果太小了,對隱藏不利;反之,就需要更長的音頻載體。所以,音頻分段與小波分解具有密切的關(guān)系。
3)倒譜變換。
復(fù)倒譜變換對于信號序列的均值大于或等于0時,其逆變換可逆;否則不可逆。為此,需要計算指定段信號的均值,若均值小于0則取反。然后對所有指定段進行復(fù)倒譜變換。
4)倒譜系數(shù)的選取。
去掉首尾波動很大的部分,而選擇中間平穩(wěn)的部分嵌入水印。假設(shè)兩端各去掉L0個數(shù)據(jù),則實際用于隱藏水印的倒譜系數(shù)長度為:
5)去均值化處理。
計算剩余部分的均值,然后用每一個倒譜系數(shù)減去該均值,得到倒譜系數(shù)的相對值。
6)嵌入水印。
給定一個閾值T,采用整體上下拉開的思路,對以上的相對倒譜系數(shù)進行修改,得到最終的倒譜系數(shù),從而實現(xiàn)水印的嵌入。
7)重構(gòu)音頻信號。
對嵌入水印的段重構(gòu)后,實施復(fù)倒譜反變換。然后進行小波重構(gòu),從而得到含有水印比特的音頻段。將所有這些段重構(gòu),就獲得了含全部水印信息的音頻。
2.3水印提取
水印提取過程的前半部分與嵌入過程是一樣。在提取出比特序列后,再經(jīng)過BCH解碼處理,從而得到隱藏的水印比特序列。水印提取的流程如圖3所示。
對獲得的倒譜系數(shù)去兩側(cè)數(shù)據(jù),計算剩下的倒譜系數(shù)平均值。按照以下規(guī)則進行隱藏信息的提。
在信息傳播方面.針對A/D和D/A傳播采用『_直通電纜的傳輸方式,在單機上用電纜將音頻輸入輸出口相連。傳輸線為音頻線1.8m和延長線1.8m,共3.6m。此外,針對手機彩鈴傳播采用了AMR方式。隱藏水印設(shè)計了三種方案,如圖4所示。
小容量的便于AMR處理,大容量的便于實用化。
仿真工具為Matlab7.2.使用windowsMediaPldrver播放器播放音頻載體,使用CoolEdit Pro工具進行錄音、編輯和攻擊處理。
基本參數(shù)選擇為:選用Harr小波進行7級小波分解后,按照式(4)選取低頻系數(shù)區(qū)域,所得頻段在77.5~5o0Hz范圍。式(7)中的為L0,式(9)中T值的合適范圍在0.005~0.025中實驗選取。式(3)中的取值為3200非常合適,此時,實際參與計算均值的數(shù)據(jù)為155。
3.2音頻載體的影響
音頻載體選擇了三種,如表1所示,
其采樣頻率8kHz,樣本精度為16b,單聲道,段的長度為3200。音頻轉(zhuǎn)換為8kHz的目的是為了今后在電話網(wǎng)上的隱蔽傳輸,并可以轉(zhuǎn)化為AMR文件,傳輸?shù)绞謾C中,成為手機彩鈴的版權(quán)管理目的。
經(jīng)過A/D和D/A傳播后,4×4水印提取的誤碼情況如表1所示?梢,載體的選用非常重要;同時,從音頻質(zhì)量上考慮,選用較小的T值更有利于保證信噪比。所以,以下的實驗采用的是“奧運主題歌”。
3.3閾值參數(shù)的合理計算
選擇了水印“北”進行比較測試,如圖5所示。結(jié)果表明,在T值為0.016時,誤碼率為0,效果最佳。為此,后續(xù)實驗也采用該值。
3.4大容量A/D和D/A傳輸
采用圖像水印“北京”進行大容量測試,音頻載體選用“奧運主題歌”。圖6為經(jīng)過A/D和D/A轉(zhuǎn)換前后的數(shù)據(jù)均值計算對比情況.共有BcH編碼的555個數(shù)據(jù)。按照式(10)
提取后,能夠完全正確提取,且誤碼率為0。進一步,將本文算法的實驗效果與已有屬于盲提取的研究結(jié)果相比較,如表2所示。
可見,本文算法雖然帶寬小,但水印能夠正確提取,而且嵌入容量較大。由于實驗中使用了8kHz的音頻載體,能夠廣泛應(yīng)用于語音傳輸和手機彩鈴等場合,所以在電話網(wǎng)絡(luò)廣播方面的實用性強。
3.5抗AMR轉(zhuǎn)換
隨著手機彩鈴的普遍使用,彩鈴的安全傳播和管理將成為新的問題。本算法在這方面也開展了新的嘗試,將水印隱藏在彩鈴中,可以起到版權(quán)保護或秘密信息傳播的作用。
目前手機錄音放音格式多數(shù)是AMR格式,要求算法能夠抵抗AMR轉(zhuǎn)換攻擊。在上述的音頻載體中成功完成水印嵌入后,需要將采樣精度l6b、采樣頻率為8000的波形音頻轉(zhuǎn)換為AMR格式,就可以存入手機中使用或發(fā)送給他人。提取時,先將AMR文件轉(zhuǎn)換為wAV格式,然后再提取水印信息。
AMR轉(zhuǎn)換工具為MIKS0FTMobiIeAMR convener,可以進行WAVE與AMR兩種格式的相互轉(zhuǎn)換。實驗中使用的水印信息為圖4(a)水印,采用BcH(31,16,3),閩值設(shè)置為0.0195時,B脒達到0,取得了滿意的效果。
4、結(jié)語
鑒于音頻信號的低頻特征,并綜合應(yīng)用倒譜技術(shù)和小波多級分解方法,成功地實現(xiàn)了抗A/D和D/A轉(zhuǎn)換的音頻水印算法,誤碼率為0,不需要同步碼;而且,隱藏信息具有較大的容量,具備了一定的實用性;同時,算法還能夠抵抗一定的AMR攻擊,既能實現(xiàn)手機彩鈴的安全傳播和管理,又能在線錄制手機通信中的含水印音頻,具有較好的應(yīng)用前景。今后,需要在AMR文件中隱藏大容量水印信息,使之更具有實用性。
【淺談面向公共信息傳播的音頻水印算法】相關(guān)文章:
基于ICA的魯棒圖像水印算法07-31
基于LDPC碼保護的DWT數(shù)字水印算法研究08-04
基于塊分類的H.264視頻水印算法08-03
淺談面向業(yè)務(wù)決策的圖書館信息集成系統(tǒng)模型研究10-09
淺談廣告?zhèn)鞑サ摹半x合”策略09-23