研究計畫書

學生姓名:井民全

專長:影像處理、影像壓縮、電腦網路、多媒體應用、數位電路設計.

碩士論文題目:

A study on face image compression.

其他著作:

(1). VLSI DESIGN FOR CONVOLUTION. (大學專題)

相關資料:

86學年度第一次資訊學門資訊學科能力測驗成積: 38/752 (名次/總人數)

這份研究計劃的大綱,主要分為三個部份:

1. 研究動機 2. 研究背景 3. 未來研究方向

研究動機

近年來由於資訊發達,網際網路的發展使得電腦不再是一座海上的孤島,資料數位化程度的快速;資訊的整合與流通將電腦聯結成一個綜合而龐大的資訊體系.隨著科技的進步,電腦衍然成為一個新媒體,使得人們的生活越來越便利.其中數位圖書館的建置讓許多人可以直接在電腦面前快速地閱讀新知,聲音、動畫配合著文字,使得人們更容易瞭解書中的知識,同時也增加了閱讀的效率. 在企業的經營管理上,微軟公司的總裁Bill Gates提出的『數位神經系統』概念中指出,「仰賴網網相連的個人電腦及整合軟體,讓體系內各種資訊正確且快速的傳達,使得決策階層得以做出快速而且正確的反應,進而提升企業的競爭力」.電腦與傳播科技大師Nicholas Negroponet先生,在『數位革命』一書曾說:「從原子潮流演變到位元潮流已是銳不可當,不可逆轉.」在網路通訊、多媒體技術日趨成熟的今天,我們也確實看到如文件資料、音樂、影片等傳統上必須借助原子形態(紙張,錄音帶,錄影帶等)交貨的商品,正漸漸地轉成位元型態,經由高效率的網路,傳送到大眾(或主管)的眼前.多媒體網路的急劇成長已經影響了人類的行為,同時也帶來一些管理以及應用的問題.

隨著資料數位化程度的增加,相伴而來的問題也一一浮現,過去原子形態所出現的一些問題,在位元形態下也會發生.例如我們過去的在紙張上撰寫的資料,本質上已有唯一與不可複製的性質存在.然而當媒體轉到位元型態下時,如何保持原來的性質是一個重要的問題.對於數位化資料的一些特性(易複製,易破壞,傳遞快速,不受地點的限制)衍生出來的問題還有版權、資訊安全 等. 從近日喧騰一時美國國家實驗室核武技術遭到竊取,可以看出問題的嚴重性.同時我們也確實看到有很多的技術被提出,並且嘗試著解決這方面的問題.例如 資料隱藏(data hiding),數位簽章,數位浮水印以及二維條碼等. 另外,隨著數位圖書館的建置,大量的資料被轉換成位元型態,然而電腦在圖形、聲音與影像的處理能力上仍然嫌不足,而content retrieval 技術的發展與MPEG 7標準的制定,都是為了解決這項問題而來;過去有鑑於此多媒體的研究與應用亦顯得熱門及重要.

每個人都有夢想,而把夢想實現的心願也同時是驅動我們向前的原動力.人類想飛所以發明了飛機,為了尋找新世界而旅行.你可以在月球上看到人類所留下的足跡,我們可以由遠方的太空船所傳回的數位影像中,得到金星地表的分佈情形,自動探測車在崎嶇的火星表面進行探測. 這些都是要靠數位影像處理技術才能讓我們看到壯麗山谷與一片死寂的大地. 科技的發展不僅帶給人類新的生活,更帶給人們實現夢想的機會.

很幸運的,我生活在這個資訊發達的時代,有足夠的資源與知識讓我浸淫,在這其中數位影像處理是一項有趣且重要的技術.在我心中一直有個夢,希望借助一些影像處理的方法及知識來實現它,我是帶著一個圓夢的心情而來.

研究背景

我在專科時代就對影像有很大興趣,曾經研究過VGA的低階程式規劃以及基本的3維座標系統,然而到了研究所才真正的接觸到影像處理演算法方面的資訊,在兩年中我修了一些基礎的課程如數位影像處理,圖形辨識,數位訊號處理.另外還選修了一些有關資訊安全(cryptography),容錯編碼(Coding theorem)與網際網路技術的課程.修完一個項目就彷彿多了一項可以運用的工具.使我將來的研究不會因此而受限.所以我在上述的一些課程學習中建立了RS (Reed Solomon) encoder / decoder, 陣列運算的程式庫(雙倍精確度),另外在我碩士論文的研究中學習到許多好用的方法,例如adaptive arithmetic encoder / decoder, polynomial approximation encoder / decoder, PCA(Principle component Analysis), DWT (Discrete Wavelet Transform), Moment Presenting Bi-level Threshold, SPIHT (Set Partitioning in Hierarchical Trees) compression scheme ….這些方法都被我以物件封裝的技術包裝起來,配合著”IMSL” C library 形成我個人專屬的程式庫.其中已經考慮程式移植到其他平台的相容性,所以程式庫的核心是標準C++程式並且採用frame work independent 的方式設計,經過測試,程式庫可以輕易的移植到各個Unix平台上執行. 因為這些程式工具的使用,使我在做實驗的時候可以很快的測試效果.做出適當的評估與判斷. 所以呢, 只要想到可以利用程式庫自己發展一套人臉辨識安全系統安裝在自家門口,就非常的興奮.這兩年的研究收獲可算是很大.

未來研究方向

我的論文題目是「A Study on face image compression. 在碩士的兩年期間,我已經完成了一個自動化人臉壓縮系統, 這個系統包括了自動人臉位置的偵測、臉部特徵的截取和一個非均量(non-uniform)的壓縮方法. 這個系統的 idea主要是觀察人類對於影像所付予的注意力會根據一些特徵(或性質)而有所不同,我們觀察到當人們去看一個人的面孔時,他們最注意的是眼睛、鼻子、嘴巴與髮型.所以我們利用wavelet transform 中區域性與多重解析度的特性,藉由我們發展出來的人臉特徵截取方法,對於不同的特徵區塊給予不同程度的壓縮以達到高壓縮率高辨認率的目標. 這個系統雖然已經達到預定的目標,可是還是有些缺點存在,例如壓縮的時間太長,壓縮倍率還有增加的空間等. 這些都是我將來要完成的工作項目.

在未來,我將會繼續在人臉方面的研究特別是對多角度的人臉影像位置偵測而影像壓縮的研究也會繼續下去,我希望把那些基本的方法弄清楚.影像辨識的研究也會加入我的研究項目中,對於影像加密與資料隱藏方面乃將來在電腦網路上傳輸之重要研究,我也很有興趣.