2.數據生命周期管理模型
前文已經劃分了生命周期的各個階段,并明確了相關的注意事項,下面將介紹數據生命周期的具體管理模型。
(1)數據在線度 隨著時間的推移,新數據不斷產生,歷史數據使用頻率不斷下降,使用價值也相應衰減到較低水平,但這個階段的劃分是相對的,在線的定義也是定性的。為了更好地體現數據的生命周期,需要定量描述數據所處的各階段,使用數據在線度( DataOn-line Level,DOL)y準確反應數據的在線程度和使用衰減情況。數據在線度與用戶對數據的訪問頻度口相關??跒閱挝粫r間內的訪問次數,與數據的遷移安全性、代價、必要性有關。假設遷移因子為m,則關聯函數為y。=,(a。,m。),其中£為時間。
在新生數據被頻繁訪問期間,即在線階段,此時y=l。隨著時間的推移,訪問頻率發生變化,數據在線度隨之加以修正,直至達到某閾值,數據即處于歸檔階段(包括在線歸檔和離線歸檔)。此后受資源所限或其他因素所致,可考慮進行數據銷毀。當y趨近于0或達到某閾值時,可對數據進行離線歸檔處理。當數據生命周期進入歸檔階段時,需要對數據進行遷移或從系統中將數據分離出來。但也有部分業務系統,因設備老化、技術限制或遷移難度大等原因,無法實現對訪問頻率下降的數據進行遷移。同時也存在一些數據雖然訪問頻率下降,但是在一段時間內仍需維持在線或在線歸檔狀態,或者借助新技術在滿足業務系統正常運轉的前提下提前對數據進行遷移的情況。遷移因子影響了數據在線度,對數據生命周期階段劃分具有阻礙或促進作用。綜上所述,在線度關聯函數如下:
其中,ao為初始上線頻繁訪問時平均訪問次數,且0≤m?!躭,f為時間,可根據數據及系統需求,將單位設為年(或月、日)等。圖8-3反映了數據在線度與數據生命周期之間的關系。