因為現有企業IT的應用和架構是從過去垂直型組織結構發展而來,應用和數據條塊分割是不可避免的,但也都或多或少地進行過一些數據集成。在我們接觸的客戶中,根據數據集成的成熟度,大概就兩類:典型傳統的垂直型應用,核心應用間幾乎都存在大量的數據兀余,數據通過上報的形式以日/周/月周期集成,由于元數據不一致和數據采集分析過程的不同,不同應用的數據口徑不一致現象經常發生,需要大量人工完成數據核對和清洗。顯而易見,這種情況下減少數據周轉周期,提供高質量的企業運營數據是很困難的,而這恰恰又是敏捷企業所需要的。
企業架構以運營數據庫為基礎,主要應用都維護一個運營數據庫的副本,并定期和運營數據庫同步。這種情況下數據周轉周期和數據的質量都是比較好的,但是由于應用和數據的禍合度太高,每個應用都存在對信息訪問的冗余邏輯,當某些應用,特別是運營數據庫的升級時,相關的應用都需要被改造,這是對業務變化快速響應的一大障礙。為了適應敏捷企業對于數據實時性、數據質量和數據訪問的靈活性的要求,這兩種類型的信息架構都需要進行改造。這種改造包括信息的虛擬化,這一點第二種類型的信息架構已經有了很好的基礎,但是需要加強元數據的管理,以提高信息、集成架構的靈活性;其次,開發和維護統一的對信息訪問的邏輯,并將其暴露為服務。
信息架構的第一個層次是現在已經存在的各種數據源,它們包括關系數據庫、數據文件、多媒體內容管理系統以及各種應用等。數據庫,但是對他們的直接訪問,信息架構的第二個層次是通過多種手段完成信息的虛擬化,經過虛擬化后的信息模型應該和業務架構中的企業信息模型相匹配。虛擬化的過程主要是信息的物理集中或虛擬集中,物理集中需要創建中心數據庫,其數據模型和企業信息模型相匹配,然后通過ETL或EI(I企業信息集成)中間件的集中(consolidation)方式將數據復制到中心數據庫,因為數據層面上的不一致性對數據進行清洗是可避免的。