數(shù)字化轉(zhuǎn)型中數(shù)據(jù)建模的問題分析與應(yīng)對(duì)策略
數(shù)字化轉(zhuǎn)型是企業(yè)利用先進(jìn)技術(shù)優(yōu)化現(xiàn)有業(yè)務(wù)模型,或創(chuàng)建新的業(yè)務(wù)模型,以用戶為中心,以數(shù)據(jù)為驅(qū)動(dòng),打破傳統(tǒng)的組織效能邊界和行業(yè)邊界,提升企業(yè)競爭力,為企業(yè)創(chuàng)造新價(jià)值的過程。數(shù)據(jù)作為新型生產(chǎn)要素,在數(shù)字化轉(zhuǎn)型中的作用不可忽視。
說到數(shù)字化,就要提到信息化。信息化是通過各種信息系統(tǒng)實(shí)現(xiàn)業(yè)務(wù)流程從線下到線上的遷移,從而提升生產(chǎn)效率和業(yè)務(wù)效率、降低成本、提高可靠性。數(shù)字化是基于信息化系統(tǒng)的運(yùn)行數(shù)據(jù),通過人工智能等技術(shù),對(duì)企業(yè)的運(yùn)營作出決策支撐。從數(shù)據(jù)的角度來看,數(shù)據(jù)是信息化過程的“副產(chǎn)品”,卻是數(shù)字化過程中支撐決策不可或缺的“原材料”,是數(shù)字化轉(zhuǎn)型的基礎(chǔ)。因此,數(shù)據(jù)質(zhì)量的高低,在一定程度上決定著數(shù)字化轉(zhuǎn)型的成敗。
數(shù)據(jù)建模是對(duì)現(xiàn)實(shí)世界各類數(shù)據(jù)的抽象組織,確定數(shù)據(jù)庫需管轄的范圍、數(shù)據(jù)的組織形式等,直至轉(zhuǎn)化成現(xiàn)實(shí)的數(shù)據(jù)庫。數(shù)據(jù)模型是源端系統(tǒng)的數(shù)據(jù)結(jié)構(gòu),也是提升數(shù)據(jù)質(zhì)量的關(guān)鍵。數(shù)據(jù)建模的目標(biāo)是創(chuàng)建一個(gè)準(zhǔn)確、一致和可理解的數(shù)據(jù)模型,以便支持?jǐn)?shù)據(jù)管理、數(shù)據(jù)分析、系統(tǒng)設(shè)計(jì)和業(yè)務(wù)決策等活動(dòng)。通過數(shù)據(jù)建模,可以幫助組織更好地理解和利用數(shù)據(jù),提高數(shù)據(jù)質(zhì)量和數(shù)據(jù)價(jià)值,支持?jǐn)?shù)字化轉(zhuǎn)型和業(yè)務(wù)創(chuàng)新。
企業(yè)數(shù)據(jù)建模的現(xiàn)狀
信息系統(tǒng)建設(shè)處在“一應(yīng)用一系統(tǒng)”狀態(tài)
在信息化建設(shè)階段,信息系統(tǒng)往往由業(yè)務(wù)部門各自牽頭建設(shè),導(dǎo)致一項(xiàng)應(yīng)用建設(shè)一個(gè)系統(tǒng),系統(tǒng)之間彼此互不相關(guān)。
如圖1所示,某企業(yè)有3個(gè)獨(dú)立的業(yè)務(wù)系統(tǒng)A、B、C,都是為滿足不同的業(yè)務(wù)需求而獨(dú)立開發(fā)的,擁有獨(dú)立的業(yè)務(wù)數(shù)據(jù)和客戶數(shù)據(jù)。從企業(yè)視角出發(fā),各個(gè)系統(tǒng)中的客戶數(shù)據(jù)屬于公共數(shù)據(jù),應(yīng)可供各個(gè)業(yè)務(wù)系統(tǒng)共享,但由于各個(gè)系統(tǒng)獨(dú)立設(shè)計(jì),很容易出現(xiàn)冗余、不一致,甚至沖突的情況。
圖1 企業(yè)信息化建設(shè)中的“一應(yīng)用一系統(tǒng)”架構(gòu)
如圖2所示,3個(gè)業(yè)務(wù)系統(tǒng)的客戶表分別為A客戶表、B客戶表和C客戶表,由于業(yè)務(wù)需要和獨(dú)立設(shè)計(jì)的原因,A客戶表的主鍵是自定義的ID,B客戶表的主鍵是統(tǒng)一信用代碼,C客戶表的主鍵是銀行賬戶。每個(gè)數(shù)據(jù)表中的地址信息也不相同,A客戶表保存的是注冊(cè)地址,B客戶表保存的是省、市、街道拆分開的地址格式,而C客戶表保存的是通信地址。從整體看,雖然每個(gè)系統(tǒng)本身運(yùn)行穩(wěn)定,但是系統(tǒng)間的集成和數(shù)據(jù)共享非常難。
圖2 3個(gè)業(yè)務(wù)系統(tǒng)客戶表截圖
這種情況不僅造成資源浪費(fèi)和運(yùn)維成本大幅提升,還很容易形成數(shù)據(jù)“孤島”。每個(gè)應(yīng)用系統(tǒng)通常有自己的數(shù)據(jù)存儲(chǔ)和管理機(jī)制,導(dǎo)致數(shù)據(jù)在不同系統(tǒng)之間存在孤立、難以共享和集成的問題,難以保證數(shù)據(jù)的一致性和準(zhǔn)確性,也限制了企業(yè)對(duì)數(shù)據(jù)的綜合分析和利用。在這種情況下,如果需要實(shí)現(xiàn)不同系統(tǒng)之間的數(shù)據(jù)共享和業(yè)務(wù)流程集成,勢必面臨較高的技術(shù)復(fù)雜性和難度,需要耗費(fèi)大量的時(shí)間、資源。
缺乏規(guī)范數(shù)據(jù)建模的數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)準(zhǔn)是保障各業(yè)務(wù)系統(tǒng)對(duì)數(shù)據(jù)統(tǒng)一理解、統(tǒng)一使用、統(tǒng)一交換的一致性、準(zhǔn)確性、完整性的規(guī)范性約束,其中包括對(duì)業(yè)務(wù)、技術(shù)和管理等數(shù)據(jù)屬性的統(tǒng)一定義。數(shù)據(jù)標(biāo)準(zhǔn)主要解決數(shù)據(jù)在共享、融合、匯集應(yīng)用中因格式不一致造成的數(shù)據(jù)處理困難。缺乏數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)建模將導(dǎo)致數(shù)據(jù)不一致、數(shù)據(jù)重復(fù)和冗余、數(shù)據(jù)集成困難、數(shù)據(jù)可理解性與可維護(hù)性差等問題。
在圖2所示的場景中,由于缺乏基于數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一管理,3個(gè)業(yè)務(wù)系統(tǒng)客戶數(shù)據(jù)的屬性、約束關(guān)系和命名規(guī)則等都存在不同程度的差異。隨著業(yè)務(wù)的發(fā)展,企業(yè)決定研發(fā)合同管理系統(tǒng),對(duì)所有的客戶數(shù)據(jù)進(jìn)行統(tǒng)一管理(如圖3所示),需要集成那些在各自系統(tǒng)中維護(hù)良好的客戶數(shù)據(jù),卻發(fā)現(xiàn)要進(jìn)行繁重的數(shù)據(jù)清洗工作,其中有些數(shù)據(jù)甚至無法使用。
圖3企業(yè)合同管理系統(tǒng)與業(yè)務(wù)系統(tǒng)關(guān)系
數(shù)據(jù)建模過度依賴平臺(tái)能力
在數(shù)字化轉(zhuǎn)型的過程中,很多企業(yè)已經(jīng)逐漸意識(shí)到“一應(yīng)用一系統(tǒng)”模式的弊端,開始逐步采用統(tǒng)一的平臺(tái)(例如致遠(yuǎn)互聯(lián)的COP平臺(tái)以及用友的BIP平臺(tái)),利用低代碼或者無代碼的開發(fā)模式打通應(yīng)用系統(tǒng),降低集成成本。這些平臺(tái)都通過表單、主表、明細(xì)表等概念來提供數(shù)據(jù)建模,因此只能進(jìn)行邏輯建模,而不能進(jìn)行物理建模,實(shí)體間的約束關(guān)系只能通過應(yīng)用來限制。當(dāng)一項(xiàng)應(yīng)用需要使用另一項(xiàng)應(yīng)用中的實(shí)體表時(shí),經(jīng)常會(huì)因?yàn)椴涣私馄浼s束關(guān)系而導(dǎo)致數(shù)據(jù)混亂,直接影響統(tǒng)計(jì)分析的準(zhǔn)確性。
忽視概念模型建模
數(shù)據(jù)建模分為3個(gè)階段:概念模型建模、邏輯模型建模和物理模型建模。在實(shí)際生產(chǎn)中,由于業(yè)務(wù)人員對(duì)信息化技術(shù)了解不多、領(lǐng)域?qū)<医槿氩簧?,概念模型建模往往被忽略,?dǎo)致數(shù)據(jù)建模從概要設(shè)計(jì)階段的邏輯模型建模開始。這必然產(chǎn)生業(yè)務(wù)人員和技術(shù)人員之間對(duì)業(yè)務(wù)實(shí)體、屬性和關(guān)系的描述不一致,以及技術(shù)人員對(duì)業(yè)務(wù)的了解不全面甚至是理解錯(cuò)誤的現(xiàn)象,最終導(dǎo)致數(shù)據(jù)缺失、冗余或不一致等問題。
應(yīng)對(duì)措施
數(shù)據(jù)建模過程中有很多技術(shù)細(xì)節(jié)需要注意,而以下三點(diǎn)尤為重要。
先有數(shù)據(jù)標(biāo)準(zhǔn)再進(jìn)行數(shù)據(jù)建模
在進(jìn)行數(shù)據(jù)建模之前,首先需要制定數(shù)據(jù)標(biāo)準(zhǔn),用來指導(dǎo)和約束數(shù)據(jù)建模。數(shù)據(jù)標(biāo)準(zhǔn)包括數(shù)據(jù)命名規(guī)范、數(shù)據(jù)類型、數(shù)據(jù)格式、數(shù)據(jù)約束等方面的規(guī)定。即便是分批建設(shè)的彼此獨(dú)立的業(yè)務(wù)系統(tǒng),也可以使用統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)以確保不同業(yè)務(wù)系統(tǒng)間數(shù)據(jù)的一致性和可集成性。
同時(shí),數(shù)據(jù)建模也可以促進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)的優(yōu)化和改進(jìn)。隨著數(shù)字化進(jìn)程的深入,產(chǎn)業(yè)各方可能發(fā)現(xiàn)有更多的數(shù)據(jù)項(xiàng)需要被納入數(shù)據(jù)標(biāo)準(zhǔn)范疇,進(jìn)而推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)體系的完善。
在圖3的場景中,如果企業(yè)建立了數(shù)據(jù)標(biāo)準(zhǔn),即便3個(gè)獨(dú)立的業(yè)務(wù)系統(tǒng)存在數(shù)據(jù)冗余,但由于數(shù)據(jù)具有統(tǒng)一的屬性、約束條件,僅需要簡單的數(shù)據(jù)治理就可以抽取3個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)為新的業(yè)務(wù)系統(tǒng)提供服務(wù),如圖4所示。
圖4 執(zhí)行統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)后的數(shù)據(jù)建模
基于數(shù)據(jù)底座進(jìn)行數(shù)據(jù)建模
雖然數(shù)據(jù)標(biāo)準(zhǔn)可以解決數(shù)據(jù)一致性問題,但是不能消除系統(tǒng)間的數(shù)據(jù)冗余。因此,在圖4所示的業(yè)務(wù)場景中,合同管理系統(tǒng)在使用系統(tǒng)A、B、C產(chǎn)生的客戶數(shù)據(jù)前,仍然需要進(jìn)行數(shù)據(jù)整理,以去掉冗余數(shù)據(jù)。
如果在整個(gè)架構(gòu)中存在多個(gè)與合同管理系統(tǒng)類似的數(shù)據(jù)消費(fèi)者系統(tǒng),那么類似的數(shù)據(jù)治理操作就要重復(fù)多次。另外,當(dāng)有新的數(shù)據(jù)生產(chǎn)者系統(tǒng)加入時(shí),所有的數(shù)據(jù)消費(fèi)者系統(tǒng)都要修改對(duì)應(yīng)的集成接口,這就增加了集成的工作量。為此,很多企業(yè)引入了數(shù)據(jù)底座,用于集中管理企業(yè)數(shù)據(jù)資產(chǎn),打通數(shù)據(jù)通道,在數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一約束下確保企業(yè)內(nèi)部數(shù)據(jù)的一致性和完整性。
數(shù)據(jù)底座在數(shù)字化轉(zhuǎn)型中起著至關(guān)重要的作用。通過在數(shù)據(jù)底座基礎(chǔ)上進(jìn)行數(shù)據(jù)建模,可以獲得企業(yè)統(tǒng)一的數(shù)據(jù)視圖,整合不同數(shù)據(jù)源的數(shù)據(jù),為業(yè)務(wù)分析和決策提供一致的數(shù)據(jù)基礎(chǔ)。圖1業(yè)務(wù)場景在引入數(shù)據(jù)底座后的架構(gòu)如圖5所示。
數(shù)據(jù)生產(chǎn)者系統(tǒng)A、B、C的數(shù)據(jù)按照集成規(guī)則存儲(chǔ)到數(shù)據(jù)底座,通過對(duì)數(shù)據(jù)底座中的整體數(shù)據(jù)進(jìn)行數(shù)據(jù)建模,可以明確數(shù)據(jù)間的關(guān)系、屬性和約束,幫助企業(yè)更好地理解和管理數(shù)據(jù)。消費(fèi)者系統(tǒng)根據(jù)需要通過數(shù)據(jù)底座提供的服務(wù)使用數(shù)據(jù),消費(fèi)者系統(tǒng)不用關(guān)心數(shù)據(jù)的來源和數(shù)據(jù)源發(fā)生的變化。當(dāng)有新的數(shù)據(jù)生產(chǎn)者系統(tǒng)加入時(shí),只要做好與數(shù)據(jù)底座的對(duì)接,就不會(huì)影響數(shù)據(jù)消費(fèi)者系統(tǒng)。
圖5引入數(shù)據(jù)底座后的企業(yè)各系統(tǒng)架構(gòu)
可以看出,上述整個(gè)數(shù)據(jù)流程都依賴于數(shù)據(jù)標(biāo)準(zhǔn)。
循序漸進(jìn)地進(jìn)行數(shù)據(jù)建模
數(shù)據(jù)建模金字塔如圖6所示,三個(gè)階段是從簡單到復(fù)雜、從抽象到具體、從需求描述到最終實(shí)現(xiàn)的循序漸進(jìn)的過程,缺一不可。
圖6數(shù)據(jù)建模金字塔
概念設(shè)計(jì)是數(shù)據(jù)建模的第一步,是需求分析中后期要由業(yè)務(wù)人員和領(lǐng)域?qū)<彝瓿傻娜蝿?wù)。通過描述業(yè)務(wù)中實(shí)體、屬性和它們之間的關(guān)系,確定業(yè)務(wù)規(guī)則和數(shù)據(jù)實(shí)體之間的關(guān)聯(lián),以加深對(duì)需求的理解,也為后續(xù)階段的工作奠定基礎(chǔ)。
邏輯模型是數(shù)據(jù)庫設(shè)計(jì)人員對(duì)概念模型的進(jìn)一步細(xì)化,定義數(shù)據(jù)實(shí)體、屬性、關(guān)系和約束,確保數(shù)據(jù)的一致性、準(zhǔn)確性和安全性。概念模型和邏輯模型主要是針對(duì)業(yè)務(wù)需求進(jìn)行抽象和設(shè)計(jì),不依賴于具體的平臺(tái)和數(shù)據(jù)庫選型。
物理模型是由數(shù)據(jù)庫管理員和開發(fā)人員將邏輯模型轉(zhuǎn)化為數(shù)據(jù)庫實(shí)現(xiàn)的具體方案,定義數(shù)據(jù)庫表、字段和索引等細(xì)節(jié)信息,同時(shí)還要考慮數(shù)據(jù)庫的性能優(yōu)化、存儲(chǔ)規(guī)劃、備份與恢復(fù)方案、安全策略,為開發(fā)人員提供數(shù)據(jù)庫編碼和實(shí)現(xiàn)的依據(jù)。
高質(zhì)量的數(shù)據(jù)建模是企業(yè)數(shù)字化轉(zhuǎn)型成功的關(guān)鍵一步,它可以統(tǒng)一并整合企業(yè)數(shù)據(jù),為企業(yè)決策提供高質(zhì)量的數(shù)據(jù)支撐。在此基礎(chǔ)上,結(jié)合人工智能技術(shù),幫助企業(yè)實(shí)現(xiàn)從業(yè)務(wù)決策到數(shù)據(jù)決策的數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化轉(zhuǎn)型。
- 上一篇
如何應(yīng)對(duì)最具風(fēng)險(xiǎn)的云計(jì)算威脅?
本文將深入探討云計(jì)算中的14大安全問題,組織必須意識(shí)到這些問題,以確保保護(hù)其敏感數(shù)據(jù)和資源。通過了解這些風(fēng)險(xiǎn),組織可以采取主動(dòng)措施。
- 下一篇
如何成功啟動(dòng)數(shù)字化轉(zhuǎn)型
在2008年金融危機(jī)的影響下,時(shí)任英國財(cái)政大臣的喬治·奧斯本(George Osborne)將轉(zhuǎn)型愿景列為優(yōu)先事項(xiàng),因?yàn)檎兄Z削減總支出,領(lǐng)導(dǎo)人將技術(shù)視為獲得更好、更高效服務(wù)的可能途徑。到2013年底,成立的政府?dāng)?shù)字服務(wù)(GDS)團(tuán)隊(duì)宣布,作為政府報(bào)告的100億英鎊效率的一部分,它已經(jīng)貢獻(xiàn)了5億英鎊的節(jié)省。