隨著競(jìng)爭(zhēng)的加劇以及話音市場(chǎng)的日益飽和,移動(dòng)運(yùn)營(yíng)商為了增加收入必須尋求新的出路,那就是開展移動(dòng)多媒體業(yè)務(wù)。在過去的一年里,移動(dòng)音樂、移動(dòng)電視等業(yè)務(wù)引起了業(yè)界極大的關(guān)注,移動(dòng)多媒體通信成為未來通信的發(fā)展趨勢(shì)。本文要探討的就是移動(dòng)多媒體通信的關(guān)鍵技術(shù)。主要介紹了和移動(dòng)多媒體通信密切相關(guān)的幾種技術(shù):網(wǎng)絡(luò)技術(shù)、視頻編碼技術(shù)、流媒體技術(shù)等。在移動(dòng)多媒體通信中,終端技術(shù)、業(yè)務(wù)平臺(tái)技術(shù)也是非常重要的,由于篇幅所限,本文不做討論。
一、使移動(dòng)多媒體通信更加有效的技術(shù)
移動(dòng)多媒體通信具備以下特點(diǎn):
①數(shù)據(jù)量大。多媒體通信的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于話音通信,例如,移動(dòng)可視電話一般采用QCIF分辨率的圖像,有176×144=25 344像素。如果每個(gè)像素由24位表示,一幀圖像的數(shù)據(jù)量就達(dá)594 kbit。實(shí)時(shí)視頻圖像傳輸要求的幀頻為25幀/s。則數(shù)據(jù)傳輸速率將達(dá)到14.5 Mbit/s。
、趯(shí)時(shí)性要求高。多媒體通信往往對(duì)實(shí)時(shí)性的要求比較高,比如視頻電話,要求延遲小、實(shí)時(shí)性好。
、蹮o線信道缺乏QoS保證。無線信道不穩(wěn)定的特點(diǎn)容易使通信不可靠,傳輸速率表現(xiàn)出時(shí)變的特點(diǎn),而且容易帶來連續(xù)、突發(fā)性的傳輸錯(cuò)誤。
、芏嗝襟w業(yè)務(wù)對(duì)終端要求較高,比如下載類的視頻業(yè)務(wù),對(duì)終端存儲(chǔ)容量也有著較高的要求,音樂、視頻類的業(yè)務(wù)需要手機(jī)能支持相應(yīng)功能。
針對(duì)移動(dòng)多媒體通信的上述特點(diǎn),人們想出了一些解決辦法。相對(duì)于移動(dòng)多媒體業(yè)務(wù)數(shù)據(jù)量大的特點(diǎn),有兩個(gè)解決辦法:一是采用更加先進(jìn)的網(wǎng)絡(luò)技術(shù),從而提高網(wǎng)絡(luò)的通信速率;另一個(gè)辦法則是采用較好的編碼技術(shù),這樣也可以使待傳輸?shù)臄?shù)據(jù)量變小。好的編碼技術(shù)還可以在一定程度上對(duì)抗無線信道不可靠的特點(diǎn),這對(duì)于提高移動(dòng)多媒體業(yè)務(wù)的質(zhì)量也大有好處。另外,針對(duì)一些需要下載的多媒體業(yè)務(wù)對(duì)終端存儲(chǔ)容量要求較高的問題,引入了流媒體技術(shù),這樣就不需要把所有的內(nèi)容都下載下來,可以邊下載邊播放,一方面可以緩解終端存儲(chǔ)空間的不足,另一方面流媒體啟動(dòng)播放的延時(shí)非常短,使用戶能夠即時(shí)收看收聽視頻業(yè)務(wù),提高了實(shí)時(shí)性。當(dāng)然,終端技術(shù)的發(fā)展,如彩屏、攝像頭、音樂功能等,對(duì)移動(dòng)多媒體業(yè)務(wù)的發(fā)展也會(huì)起到保障和推動(dòng)作用。
二、網(wǎng)絡(luò)技術(shù)發(fā)展
今天3G移動(dòng)通信系統(tǒng)在很多國(guó)家已經(jīng)進(jìn)入商用,然而,隨著移動(dòng)多媒體業(yè)務(wù)的發(fā)展,3G已經(jīng)不能滿足人們的需要了,其局限性主要體現(xiàn)在以下幾個(gè)方面。
、匐y以達(dá)到較高的通信速率。3G最高可支持2 Mbit/s的速率。然而在高速移動(dòng)環(huán)境下,卻遠(yuǎn)遠(yuǎn)達(dá)不到這一速率,因此不能滿足用戶對(duì)高速多媒體業(yè)務(wù)的要求。
、陔y以提供動(dòng)態(tài)范圍多速率業(yè)務(wù)。由于3G空中接口標(biāo)準(zhǔn)對(duì)核心網(wǎng)有所限制,因此3G將難以提供具有多種QoS及性能的各種速率的業(yè)務(wù)。
、垭y以實(shí)現(xiàn)不同頻段的不同業(yè)務(wù)環(huán)境間的無縫漫游。由于采用不同頻段的不同業(yè)務(wù)環(huán)境需要移動(dòng)終端配置有相應(yīng)不同的軟、硬件模塊,而3G移動(dòng)終端目前尚不能夠?qū)崿F(xiàn)多業(yè)務(wù)環(huán)境的不同配置。
以上3G系統(tǒng)的一些局限性,人們希望能夠通過第四代移動(dòng)通信來解決。4G系統(tǒng)具有如下特點(diǎn):
①速率更快。4G通信系統(tǒng)的速率可以達(dá)到10~20 Mbit/s,最高可達(dá)100 Mbit/s。
、诟飨到y(tǒng)(IMT-2000、WLAN、BWA、衛(wèi)星、廣播等)之間無縫的業(yè)務(wù)支持,并提供全球無縫漫游。
、壑С侄喾N模式、對(duì)稱/非對(duì)稱業(yè)務(wù)。
、苋獻(xiàn)P網(wǎng)絡(luò),支持QoS。
1999年成立的ITU-R的WP8F工作組的主要任務(wù)就是負(fù)責(zé)3G未來發(fā)展和超3G的研究。超3G是ITU定義的Systems Beyond IMT-2000的簡(jiǎn)稱,顧名思義,是超越3G系統(tǒng),目前所稱的第四代移動(dòng)通信實(shí)際上就是指ITU提出的超3G系統(tǒng)。ITU的超3G工作計(jì)劃是全面啟動(dòng)超IMT2000業(yè)務(wù)、市場(chǎng)、技術(shù)和頻譜需求的研究。
目前,歐洲、日本、韓國(guó)、美國(guó)以及我國(guó)也都啟動(dòng)了超3G/4G的研究,NTT DoCoMo、AT&T、Nortel、SKT等公司也積極地進(jìn)行了相關(guān)的研發(fā)和試驗(yàn),并已取得了初步的成績(jī)。
三、視頻編碼技術(shù)
在移動(dòng)多媒體通信中,圖像、文本、音頻數(shù)據(jù)都需要編碼,但是由于其中視頻通信的數(shù)據(jù)量最大,最有代表性,因而,本章主要介紹視頻編碼技術(shù)。
目前常用的視頻編碼格式有MPEG-4、H.263、Nancy Codec。
1.MPEG-4
MPEG是動(dòng)態(tài)圖像專家組(Moving Pictures Experts Group)的英文縮寫,該專家組成立于1988年,致力于運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作,原先他們打算開發(fā)MPEG-1、MPEG-2、MPEG-3和MPEG-4四個(gè)版本,以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。
目前,MPEG-1技術(shù)被廣泛應(yīng)用于VCD,而MPEG-2標(biāo)準(zhǔn)則用于廣播電視和DVD等。MPEG-3最初是為HDTV開發(fā)的編碼和壓縮標(biāo)準(zhǔn),但由于MPEG-2的出色性能表現(xiàn),MPEG-3最終沒有出臺(tái)。而MPEG-4從1999年開始正式成為國(guó)際標(biāo)準(zhǔn),其標(biāo)準(zhǔn)名稱為甚低速率視聽編碼(Very-low bitrate audio-visual coding)。
MPEG-4引入了基于對(duì)象的概念——視聽對(duì)象(AVO),使更多交互操作成為可能。AVO可以是一個(gè)人物,也可以是這個(gè)人物的語音或者一段背景音樂。它具有高效編碼、高效存儲(chǔ)與傳播及可交互操作的特性。MPEG-4對(duì)AVO的操作主要有:采用AVO來表示聽覺、視覺或者視聽組合內(nèi)容;組合已有的AVO來生成復(fù)合的AVO,并生成視聽場(chǎng)景;對(duì)AVO的數(shù)據(jù)靈活地多路合成與同步,這樣便于選擇合適的網(wǎng)絡(luò)來傳輸對(duì)象數(shù)據(jù);允許接收端的用戶在視聽場(chǎng)合中對(duì)AVO進(jìn)行交互操作。
MPEG-4標(biāo)準(zhǔn)由下面幾個(gè)部分組成:
、賯鬏敹嗝襟w集成框架(DMIF)
DMIF是MPEG-4制定的會(huì)話協(xié)議,用來管理多媒體數(shù)據(jù)流。該協(xié)議與文件傳輸協(xié)議相似,不同的是,文件傳輸協(xié)議返回的是數(shù)據(jù),而DMIF返回的是指向到何處獲取數(shù)據(jù)流的指針。
、趫(chǎng)景描述
MPEG-4提供了一系列工具,用于組成場(chǎng)景中的一組對(duì)象。一些必要的合成信息就組成了場(chǎng)景描述。
③音頻編碼
MPEG-4不僅支持自然聲音,而且支持合成聲音。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對(duì)象特征。MPEG-4的譯碼器還支持MIDI合成音樂和文本到語音(TTS)的轉(zhuǎn)換。
、芤曨l編碼
與音頻編碼類似,MPEG-4也支持對(duì)自然和合成的視覺對(duì)象的編碼。合成的視覺對(duì)象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等。
2.H.263
H.263是ITU-T推出的碼率低于64 kbit/s的低碼率視頻壓縮標(biāo)準(zhǔn),是一種集圖像幀間預(yù)測(cè)(降低圖像的時(shí)間冗余度)和離散余弦變換(DCT)編碼(降低圖像的空間冗余度)于一體的混合編碼結(jié)構(gòu),具有較高的壓縮比,適合于無線視頻傳輸。采用的基本技術(shù)包括:DCT變換、運(yùn)動(dòng)補(bǔ)償、量化、熵編碼等,其核心是離散余弦變換加運(yùn)動(dòng)補(bǔ)償(DCT+MC)。
典型的H.263視頻流由一個(gè)I幀(intra-frame)和幾個(gè)P幀(inter-frame)構(gòu)成。I幀是獨(dú)立編碼的,沒有采用任何參考幀,可以獨(dú)立解碼;P幀是由當(dāng)前幀和前一個(gè)P幀的差值編碼構(gòu)成的。若采用QCIF格式(176×144像素),一幅圖像被分成99(11×9)個(gè)宏塊(MB),每個(gè)宏塊由4個(gè)8×8的亮度塊和2個(gè)8×8的色度塊構(gòu)成,11個(gè)連續(xù)的MB就構(gòu)成了一個(gè)GOB(Group of Blocks)
3.Nancy Codec
Nancy Codec是日本OFFICE NOA公司開發(fā)的一項(xiàng)技術(shù),與業(yè)界公認(rèn)標(biāo)準(zhǔn)MPEG-4相比,在技術(shù)上有很大的不同。在Nancy Codec中,它并沒有采用目前流行的離散余弦變換及小波變換,而是使用了OFFICE NOA獨(dú)自開發(fā)的結(jié)構(gòu)化比例多邊形(SMSP)技術(shù),將圖像按不同形狀與尺寸進(jìn)行模塊化分割,然后再壓縮。它是一種全新的算法,不需要進(jìn)行動(dòng)態(tài)預(yù)測(cè),完全擺脫了通過使用變換頻率的手段來實(shí)現(xiàn)高頻成分時(shí)所產(chǎn)生的損耗,也擺脫了動(dòng)態(tài)預(yù)測(cè)的束縛。Nancy Codec只需運(yùn)用簡(jiǎn)單的算術(shù)算法如整數(shù)的加減,字節(jié)變換和比較等運(yùn)算就可以完成畫面處理,故它能在采用8位CPU的平臺(tái)上運(yùn)行,這樣的要求能使移動(dòng)電話可以采用小尺寸的芯片進(jìn)行視頻的壓縮和解壓縮。
4.幾種視頻壓縮技術(shù)的比較
目前MPEG-4和H.263都是成熟標(biāo)準(zhǔn),是3GPP支持的標(biāo)準(zhǔn),有手機(jī)支持,缺點(diǎn)是壓縮算法比較復(fù)雜。而Nancy壓縮算法很簡(jiǎn)單,只有MPEG-4 1/10以下的負(fù)荷,缺點(diǎn)是其不是3GPP標(biāo)準(zhǔn)支持的文件格式。
四、流媒體技術(shù)
所謂流媒體技術(shù)是把連續(xù)的影像和聲音信息經(jīng)過壓縮之后放到網(wǎng)絡(luò)服務(wù)器上,移動(dòng)終端用戶可以一邊下載一邊播放,這樣用戶的等待時(shí)間不需要很長(zhǎng)。流媒體技術(shù)是采用流式傳輸?shù)姆绞皆诰W(wǎng)絡(luò)上傳輸音頻、視頻等格式的多媒體文件。流媒體是和下載播放相對(duì)的,即在播放前并不下載整個(gè)文件,只將開始部分內(nèi)容存入內(nèi)存,這樣就不需要移動(dòng)終端有太強(qiáng)的存儲(chǔ)功能。
1.流媒體編碼格式
目前主流的流媒體格式有RealNetworks公司的Real System,Microsoft公司的Windows Meia Technology和Apple公司的QuickTime,它們是網(wǎng)上流媒體傳輸系統(tǒng)的3大主流。
①Real System
Real System由媒體內(nèi)容制作工具(Real Producer)、服務(wù)器(RealServer)、客戶端軟件(Client Software)組成。相應(yīng)的流媒體文件包括Real Audio、RealVideo、RealPresentation和RealFlash幾類,用于傳輸不同的文件。Real System采用SureStream技術(shù),自動(dòng)并持續(xù)地調(diào)整數(shù)據(jù)流的流量以適應(yīng)實(shí)際應(yīng)用中的各種不同網(wǎng)絡(luò)帶寬需求,輕松地在網(wǎng)上實(shí)現(xiàn)視音頻和三維動(dòng)畫。
、赪indows Media
Windows Media技術(shù)是微軟公司推出的,其前身是微軟公司的Netshow產(chǎn)品,目的是在網(wǎng)上實(shí)現(xiàn)包括音頻、視頻在內(nèi)的多媒體流信息的傳輸。Windows Media技術(shù)由Media Tools、Media Sever和Media Player工具構(gòu)成。
、跶uickTime
Apple公司于1991年開始發(fā)布QuickTime,它幾乎支持所有主流的個(gè)人計(jì)算平臺(tái)和各種格式的靜態(tài)圖像文件、視頻和動(dòng)畫格式,具有內(nèi)置Web瀏覽器插件(Plug-in)技術(shù)、支持IETF流標(biāo)準(zhǔn)以及RPT、RTSP、SDP、FTP和HTTP等網(wǎng)絡(luò)協(xié)議。
Quick Time包括:服務(wù)器(Quick Time Streaming server)、帶編輯功能的播放器(QuickTime Player)、制作工具(Quick Time4 Pro)、圖像瀏覽器(Picture Viewer)以及使Internet瀏覽器能夠播放Quick Time,影片的Quick Time插件。
2.流式傳輸協(xié)議
、賹(shí)時(shí)傳輸協(xié)議
實(shí)時(shí)傳輸協(xié)議(RTP)是用于Internet上針對(duì)多媒體數(shù)據(jù)流的一種傳輸協(xié)議。RTP被定義為在一對(duì)一或一對(duì)多的傳輸情況下工作,其目的是提供時(shí)間信息和實(shí)現(xiàn)流同步。RTP通常使用UDP來傳送數(shù)據(jù),但RTP也可以在TCP或ATM等其他協(xié)議之上工作。當(dāng)應(yīng)用程序開始一個(gè)RTP會(huì)話時(shí)將使用兩個(gè)端口:一個(gè)給RTP,一個(gè)給RTCP。RTP本身并不能為按順序傳送數(shù)據(jù)包提供可靠的傳送機(jī)制,也不提供流量控制或擁塞控制,它依靠RTCP提供這些服務(wù)。通常RTP算法并不作為一個(gè)獨(dú)立的網(wǎng)絡(luò)層來實(shí)現(xiàn),而是作為應(yīng)用程序代碼的一部分。
、趯(shí)時(shí)傳輸控制協(xié)議
實(shí)時(shí)傳輸控制協(xié)議(RTCP)和RTP一起提供流量控制和擁塞控制服務(wù)。在RTP會(huì)話期間,各參與者周期性地傳送RTCP包。RTCP包中含有已發(fā)送的數(shù)據(jù)包的數(shù)量、丟失的數(shù)據(jù)包的數(shù)量等統(tǒng)計(jì)資料。因此,服務(wù)器可以利用這些信息動(dòng)態(tài)地改變傳輸速率,甚至改變有效載荷類型。RTP和RTCP配合使用,他們能以有效的反饋和最小的開銷使傳輸效率最佳化,因而特別適合傳送網(wǎng)上的實(shí)時(shí)數(shù)據(jù)。
、蹖(shí)時(shí)流協(xié)議
實(shí)時(shí)流協(xié)議(RTSP)是由Real Networks和Netscape共同提出的。該協(xié)議定義了一對(duì)多應(yīng)用程序如何有效地通過IP網(wǎng)絡(luò)傳送多媒體數(shù)據(jù)。RTSP在體系結(jié)構(gòu)上位于RTP和RTCP之上,它使用TCP或RTP完成數(shù)據(jù)傳輸。
、苜Y源預(yù)留協(xié)議
資源預(yù)留協(xié)議(RSVP)是正在開發(fā)的Internet上的資源預(yù)訂協(xié)議,使用RSVP能在一定程度上為流媒體的傳輸提供QoS,但該協(xié)議不傳輸數(shù)據(jù)。
|