5.1 元數(shù)據(jù)管理概述
1.元數(shù)據(jù)
人類大腦思維非常神奇,往往可以習(xí)慣地利用數(shù)據(jù)模型將數(shù)據(jù)和信息加以結(jié)構(gòu)化,還可以利用元數(shù)據(jù)進(jìn)行釋義并形成數(shù)據(jù);同時(shí),通過(guò)大腦思維的識(shí)別、轉(zhuǎn)化、擴(kuò)充、統(tǒng)計(jì)、分析和挖掘等,可以獲取衍生信息,并同樣利用數(shù)據(jù)模型和元數(shù)據(jù)進(jìn)行結(jié)構(gòu)化和釋義。
元數(shù)據(jù)最早于1969年由Jack E.Myers提出。長(zhǎng)期以來(lái),在銀行領(lǐng)域,元數(shù)據(jù)主要應(yīng)用在數(shù)據(jù)倉(cāng)庫(kù)。在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)是用以描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。
對(duì)于數(shù)據(jù)倉(cāng)庫(kù)這類集成類數(shù)據(jù)系統(tǒng)來(lái)說(shuō),存儲(chǔ)的表、視圖等數(shù)據(jù)對(duì)象數(shù)以萬(wàn)計(jì),再加上內(nèi)部復(fù)雜的數(shù)據(jù)抽取、加載和轉(zhuǎn)換,聯(lián)機(jī)分析處理( On Line Analytical Processing,OLAP)和數(shù)據(jù)挖掘,以及眾多的數(shù)據(jù)集市,很容易形成“蜘蛛網(wǎng)”現(xiàn)象。而解決“蜘蛛網(wǎng)”問(wèn)題的關(guān)鍵就在于元數(shù)據(jù)管理,它可以幫助最終用戶理解和使用數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),也是保證數(shù)據(jù)質(zhì)量的關(guān)鍵。同樣,它也應(yīng)用在圖書館日常管理中。圖書館中的書籍多如繁星,要想在浩瀚的書海中快速準(zhǔn)確定位到某種想要選擇的具體書籍,書簽必不可少,而書簽就是書籍的元數(shù)據(jù)。
根據(jù)銀行數(shù)據(jù)特點(diǎn),結(jié)合業(yè)界理論和實(shí)踐經(jīng)驗(yàn),元數(shù)據(jù)一般可以分為業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)、操作元數(shù)據(jù)三個(gè)類別,內(nèi)容覆蓋結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)。