視頻信息檢索的必要性
視頻檢索是從大量的視頻數(shù)據(jù)中根據(jù)用戶提出的檢索請求快速找到相關(guān)的視頻信息技術(shù),包括基于內(nèi)容的視頻檢索基于壓縮域的視頻檢索、基于語義的視頻檢索以及動態(tài)特征的提取等;旨在幫助用戶在已有的數(shù)據(jù)庫中檢索所需的視頻序列,實際應用主要有數(shù)字圖書館新聞廣播、商業(yè)廣告、音樂視頻、遠程學習、視頻檔案及醫(yī)學應用等領(lǐng)域。
由于視頻數(shù)據(jù)包含的信息量大,數(shù)據(jù)的結(jié)構(gòu)也較為復雜,因而表現(xiàn)出一些與其他媒體形式的數(shù)據(jù)不同的特點。
(1)海量的數(shù)據(jù)
這是視頻數(shù)據(jù)最顯著的特點。視頻數(shù)據(jù)的數(shù)據(jù)量大約比結(jié)構(gòu)記錄數(shù)據(jù)大7個數(shù)量級,一幅中等分辨率( 640x480)的圖像,顏色為24 bit/ pixel,數(shù)字視頻圖像的數(shù)據(jù)量大約為1 M,若播放速度每秒30幀,則1s的數(shù)據(jù)量約為30M,-一個160G的硬盤也只能存放90min左右的動態(tài)圖像。隨著壓縮技術(shù)的發(fā)展,壓縮后的視頻數(shù)據(jù)量仍然相當大,巨大的數(shù)據(jù)量給視頻儲存、分析和處理等都帶來了很大的困難。
(2)結(jié)構(gòu)復雜
相對于視頻數(shù)據(jù),文本數(shù)據(jù)是一種純字符數(shù)值型數(shù)據(jù),不具有時間和空間的屬性,可以將其看作是一維海量的數(shù)據(jù)。圖像數(shù)據(jù)只具有空間屬性,沒有時間屬性,可以看作二維數(shù)據(jù);而視頻數(shù)據(jù)是一種由一系列沿時間軸順序分布的圖像形成的流結(jié)構(gòu),在每一頓圖像上不但包含空間特性,又包括時間特性,因此是三維數(shù)據(jù),這使得視頻數(shù)據(jù)在表達和模型建立上變得困難,對它的處理也最復雜。
正因為視頻數(shù)據(jù)以上的特點,使得對視頻數(shù)據(jù)進行組織、表達、存儲、管理、查詢和檢索成為對傳統(tǒng)數(shù)據(jù)庫技術(shù)提出的重大挑戰(zhàn)。例如影視行業(yè)產(chǎn)生的大量音視頻資料,若采用傳統(tǒng)媒體資料管理方式,則查找一段所需資料可能需要幾小時甚至幾天的時間,因此,落后的檢索方式已遠不能滿足人們的需求,尋找有效的進行視頻檢索的方法正在變得越來越重要。