聊聊數(shù)據(jù)倉(cāng)庫(kù)建設(shè)步驟
預(yù)計(jì)到2025年,全球數(shù)據(jù)量將增長(zhǎng)至180ZB,企業(yè)必須處理兩個(gè)主要問(wèn)題——在哪里存儲(chǔ)數(shù)據(jù)以及如何使用數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)自20世紀(jì)80年代以來(lái)就已經(jīng)存在,并且其功能不斷擴(kuò)展,可以幫助應(yīng)對(duì)這兩個(gè)挑戰(zhàn)。然而,根據(jù)獨(dú)立市場(chǎng)研究公司VansonBourne的研究,無(wú)論技術(shù)成熟度如何,而且數(shù)據(jù)倉(cāng)庫(kù)通常由專(zhuān)家開(kāi)發(fā),失敗項(xiàng)目的比例仍然高居不下。
在本文中,我們將通過(guò)概述數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)和數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)步驟的兩種基本方法來(lái)深入探討數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)的細(xì)節(jié)。
什么是數(shù)據(jù)倉(cāng)庫(kù)以及為什么要構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)?
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)系統(tǒng),它以適合分析查詢(xún)和報(bào)告的形式整合和存儲(chǔ)來(lái)自不同來(lái)源的企業(yè)信息,以支持商業(yè)智能和數(shù)據(jù)分析計(jì)劃。這種存儲(chǔ)庫(kù)的成功實(shí)施能夠帶來(lái)多種好處,包括:
以業(yè)務(wù)發(fā)展速度做出的基于事實(shí)的決策,因?yàn)樽罱K用戶(hù)可以輕松訪(fǎng)問(wèn)和使用公司的歷史信息以及從不同異構(gòu)系統(tǒng)收集的當(dāng)前信息。
基于高質(zhì)量信息的決策,因?yàn)閿?shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前會(huì)經(jīng)過(guò)全面的清洗和轉(zhuǎn)換過(guò)程。除此之外,許多數(shù)據(jù)管理活動(dòng)變得自動(dòng)化,這有助于消除容易出錯(cuò)的手動(dòng)數(shù)據(jù)聚合。
當(dāng)數(shù)據(jù)倉(cāng)庫(kù)與自助式BI解決方案(例如PowerBI或Tableau)集成時(shí),數(shù)據(jù)文化自然會(huì)在整個(gè)公司中采用。
由于統(tǒng)一的數(shù)據(jù)治理方法,除了其他方面意味著數(shù)據(jù)安全策略的可靠定義和管理之外,數(shù)據(jù)泄露和泄漏的風(fēng)險(xiǎn)也被最小化。
數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)的3個(gè)核心組件
當(dāng)創(chuàng)建未來(lái)數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)時(shí),必須考慮多種因素,例如有多少數(shù)據(jù)源將連接到數(shù)據(jù)倉(cāng)庫(kù)、每個(gè)數(shù)據(jù)源中的信息量及其性質(zhì)和復(fù)雜性、分析目標(biāo)、現(xiàn)有技術(shù)環(huán)境等。然而,說(shuō)每個(gè)架構(gòu)都是獨(dú)一無(wú)二的是錯(cuò)誤的,因?yàn)閷?shí)際上每個(gè)架構(gòu)都具有以下三個(gè)組件:
源系統(tǒng)——捕獲交易的操作數(shù)據(jù)庫(kù)、物聯(lián)網(wǎng)設(shè)備流傳感器數(shù)據(jù)、SaaS應(yīng)用程序、外部數(shù)據(jù)源等。
數(shù)據(jù)暫存區(qū)域–臨時(shí)托管復(fù)制數(shù)據(jù)的區(qū)域和一組流程,可幫助加載到數(shù)據(jù)倉(cāng)庫(kù)之前根據(jù)業(yè)務(wù)定義的規(guī)則清理和轉(zhuǎn)換數(shù)據(jù)。有了暫存區(qū),就可以擁有原始數(shù)據(jù)的歷史記錄,以防ETL作業(yè)失敗。通常,一旦ETL作業(yè)成功完成,暫存區(qū)中的信息就會(huì)被刪除。但是,仍可以出于遺留原因?qū)⑵浔4嬉欢螘r(shí)間或存檔。如果所有數(shù)據(jù)轉(zhuǎn)換都發(fā)生在數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)本身中,則可以省略該區(qū)域。
數(shù)據(jù)存儲(chǔ)–為特定部門(mén)或業(yè)務(wù)線(xiàn)創(chuàng)建的公司范圍信息和數(shù)據(jù)集市的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)。
除了這些內(nèi)容之外,企業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案還包含數(shù)據(jù)治理和元數(shù)據(jù)管理組件。擴(kuò)展數(shù)據(jù)倉(cāng)庫(kù)環(huán)境還可以包括OLAP立方體(存儲(chǔ)聚合數(shù)據(jù)以實(shí)現(xiàn)交互式查詢(xún)的多維數(shù)據(jù)結(jié)構(gòu))和數(shù)據(jù)訪(fǎng)問(wèn)層(供最終用戶(hù)訪(fǎng)問(wèn)和操作所存儲(chǔ)信息的工具和應(yīng)用程序)。然而,這些內(nèi)容是更大的生態(tài)系統(tǒng)(BI架構(gòu))的一部分,因此我們不會(huì)在這里探討它們。
使用Itransition構(gòu)建高性能數(shù)據(jù)倉(cāng)庫(kù)
構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的方法
用于構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的兩種基本設(shè)計(jì)方法是Inmon(自上而下)和Kimball(自下而上)方法。
Inmon的方法
在Inmon的方法中,首先,根據(jù)規(guī)范化數(shù)據(jù)模型設(shè)計(jì)企業(yè)信息的集中存儲(chǔ)庫(kù),其中原子數(shù)據(jù)存儲(chǔ)在表中,這些表借助聯(lián)接按主題領(lǐng)域分組在一起。企業(yè)數(shù)據(jù)倉(cāng)庫(kù)建成后,存儲(chǔ)的數(shù)據(jù)用于構(gòu)建數(shù)據(jù)集市。
當(dāng)需要執(zhí)行以下操作時(shí),Inmon的方法更為可取:
獲取單一事實(shí)來(lái)源,同時(shí)確保數(shù)據(jù)一致性、準(zhǔn)確性和可靠性
快速開(kāi)發(fā)數(shù)據(jù)集市,無(wú)需重復(fù)從原始來(lái)源提取數(shù)據(jù)、清理等。
然而,該方法的主要限制之一是,與Kimball的方法相比,設(shè)置和實(shí)施需要更多的時(shí)間和資源。
Kimball的方法
Kimball的方法建議首先創(chuàng)建維度數(shù)據(jù)集市,然后如果需要,公司可以繼續(xù)創(chuàng)建邏輯企業(yè)數(shù)據(jù)倉(cāng)庫(kù)。
這種方法的倡導(dǎo)者指出,由于維度數(shù)據(jù)集市需要最少的規(guī)范化,因此此類(lèi)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目需要更少的時(shí)間和資源。另一方面,可能會(huì)在表中發(fā)現(xiàn)重復(fù)數(shù)據(jù),并且必須重復(fù)ETL活動(dòng),因?yàn)槊總€(gè)數(shù)據(jù)集市都是獨(dú)立創(chuàng)建的。
圖片
盡管這兩種方法可能看起來(lái)相當(dāng)不同,但它們可以很好地互補(bǔ),結(jié)合兩種設(shè)計(jì)方法原理的替代方法的出現(xiàn)證明了這一點(diǎn)。
構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的分步指南
通常的做法是通過(guò)全面的準(zhǔn)備情況評(píng)估來(lái)啟動(dòng)數(shù)據(jù)倉(cāng)庫(kù)計(jì)劃。在評(píng)估數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的準(zhǔn)備情況時(shí),請(qǐng)考慮以下因素:
擁有強(qiáng)大的業(yè)務(wù)支持者——有影響力的管理者,他們可以預(yù)見(jiàn)該計(jì)劃的潛力并幫助推廣它。
業(yè)務(wù)動(dòng)機(jī)——數(shù)據(jù)倉(cāng)庫(kù)是否可以幫助解決一些關(guān)鍵業(yè)務(wù)問(wèn)題。
目前整個(gè)公司的數(shù)據(jù)成熟度——換句話(huà)說(shuō),最終用戶(hù)是否意識(shí)到數(shù)據(jù)驅(qū)動(dòng)決策、高數(shù)據(jù)質(zhì)量等的重要性。
IT專(zhuān)家和業(yè)務(wù)用戶(hù)協(xié)作的能力。
現(xiàn)有技術(shù)和數(shù)據(jù)環(huán)境的可行性。
在評(píng)估了項(xiàng)目的準(zhǔn)備情況并希望對(duì)其感到滿(mǎn)意之后,需要開(kāi)發(fā)一個(gè)用于項(xiàng)目規(guī)劃和管理的框架,然后最終繼續(xù)進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā),這從業(yè)務(wù)需求的定義開(kāi)始。
1.業(yè)務(wù)需求定義
業(yè)務(wù)需求幾乎影響整個(gè)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)過(guò)程中的每一個(gè)決策——從應(yīng)該提供哪些信息到應(yīng)該多久訪(fǎng)問(wèn)一次信息。因此,可以從調(diào)研業(yè)務(wù)用戶(hù)開(kāi)始定義:
公司的總體目標(biāo)以及特定業(yè)務(wù)部門(mén)、部門(mén)等的目標(biāo)。
用于衡量成功的方法和指標(biāo)
企業(yè)面臨的關(guān)鍵問(wèn)題
公司當(dāng)前執(zhí)行的常規(guī)數(shù)據(jù)分析的類(lèi)型,包括用于分析的數(shù)據(jù)、分析進(jìn)行的頻率、帶來(lái)的潛在改進(jìn)等)。
在采訪(fǎng)業(yè)務(wù)用戶(hù)時(shí),還應(yīng)該與關(guān)鍵IT專(zhuān)家(數(shù)據(jù)庫(kù)管理員、運(yùn)營(yíng)源系統(tǒng)專(zhuān)家等)進(jìn)行有效的溝通,以確定當(dāng)前可用的信息是否足以滿(mǎn)足以下業(yè)務(wù)需求:
關(guān)鍵操作系統(tǒng)
數(shù)據(jù)更新頻率
歷史數(shù)據(jù)的可用性
設(shè)置哪些流程來(lái)確保向業(yè)務(wù)用戶(hù)交付信息
使用哪些工具來(lái)訪(fǎng)問(wèn)和分析信息
通常會(huì)生成哪些類(lèi)型的見(jiàn)解
臨時(shí)的信息請(qǐng)求是否得到妥善處理等。
2.數(shù)據(jù)倉(cāng)庫(kù)概念化和技術(shù)選擇
上一步的結(jié)果將用作定義未來(lái)解決方案范圍的基礎(chǔ),因此應(yīng)仔細(xì)分析業(yè)務(wù)和IT用戶(hù)的需求和期望并確定優(yōu)先級(jí),以制定最佳的數(shù)據(jù)倉(cāng)庫(kù)功能集。
之后,必須確定構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)解決方案的架構(gòu)方法,評(píng)估并為每個(gè)架構(gòu)組件(暫存區(qū)域、存儲(chǔ)區(qū)域等)選擇最佳技術(shù)。在制定技術(shù)堆棧時(shí),請(qǐng)考慮以下因素:
當(dāng)前的技術(shù)環(huán)境
規(guī)劃的戰(zhàn)略技術(shù)方向
內(nèi)部IT團(tuán)隊(duì)成員的技術(shù)能力
具體數(shù)據(jù)安全要求等
此時(shí),還應(yīng)該定義部署選項(xiàng)-本地、云或混合。部署選項(xiàng)的選擇取決于多種因素,例如數(shù)據(jù)量、數(shù)據(jù)性質(zhì)、成本、安全要求、用戶(hù)數(shù)量及其位置以及系統(tǒng)可用性等。
3.數(shù)據(jù)倉(cāng)庫(kù)環(huán)境設(shè)計(jì)
在設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)之前和期間,需要定義數(shù)據(jù)源并分析存儲(chǔ)在其中的信息-可用的數(shù)據(jù)類(lèi)型和結(jié)構(gòu),每天、每月生成的信息量等,以及其質(zhì)量、敏感性、刷新率頻率。
下一步是邏輯數(shù)據(jù)建模,或者將公司的數(shù)據(jù)排列成一系列稱(chēng)為實(shí)體(現(xiàn)實(shí)世界對(duì)象)和屬性(定義這些對(duì)象的特征)的邏輯關(guān)系。實(shí)體關(guān)系建模用于各種建模技術(shù),包括規(guī)范化模式(關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)方法)和星型模式(用于維度建模)。
接下來(lái),將這些邏輯數(shù)據(jù)模型轉(zhuǎn)換為數(shù)據(jù)庫(kù)結(jié)構(gòu),例如將實(shí)體轉(zhuǎn)換為表、將屬性轉(zhuǎn)換為列、將關(guān)系轉(zhuǎn)換為外鍵約束等。
數(shù)據(jù)建模完成后,第一步是設(shè)計(jì)數(shù)據(jù)暫存區(qū),以便首先為數(shù)據(jù)倉(cāng)庫(kù)提供高質(zhì)量的聚合數(shù)據(jù),并在后續(xù)所有數(shù)據(jù)加載過(guò)程中定義和控制源到目標(biāo)的數(shù)據(jù)流。
設(shè)計(jì)步驟還包括創(chuàng)建數(shù)據(jù)訪(fǎng)問(wèn)和使用策略、建立元數(shù)據(jù)目錄、業(yè)務(wù)術(shù)語(yǔ)表等。
4.數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)與上線(xiàn)
該步驟從定制和配置所選技術(shù)(DW平臺(tái)、數(shù)據(jù)轉(zhuǎn)換技術(shù)、數(shù)據(jù)安全軟件等)開(kāi)始。然后,該公司開(kāi)發(fā)ETL管道并引入數(shù)據(jù)安全性。
引入所有主要組件后,它們必須與現(xiàn)有的數(shù)據(jù)基礎(chǔ)設(shè)施(數(shù)據(jù)源、BI和分析軟件、數(shù)據(jù)湖等)以及彼此集成,以便之后可以遷移數(shù)據(jù)。
在最終匯總之前,必須確保最終用戶(hù)能夠處理新技術(shù)環(huán)境,這意味著他們所有人都了解可用的信息、其含義、如何訪(fǎng)問(wèn)這些信息以及使用哪些工具。針對(duì)標(biāo)準(zhǔn)用戶(hù)和高級(jí)用戶(hù)的定制培訓(xùn)以及支持文檔將對(duì)此有所幫助。除此之外,還需要:
測(cè)試數(shù)據(jù)倉(cāng)庫(kù)性能、ETL等。
驗(yàn)證數(shù)據(jù)質(zhì)量(數(shù)據(jù)易讀性、完整性、安全性等)
確保用戶(hù)有權(quán)訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)等。
5.上線(xiàn)后支持與維護(hù)
初始部署后,需要關(guān)注業(yè)務(wù)用戶(hù)并提供持續(xù)的支持和培訓(xùn)。隨著時(shí)間的推移,必須測(cè)量數(shù)據(jù)倉(cāng)庫(kù)性能指標(biāo)和用戶(hù)滿(mǎn)意度評(píng)分,因?yàn)樗鼘椭_保數(shù)據(jù)倉(cāng)庫(kù)的長(zhǎng)期健康和增長(zhǎng)。
需要可靠的技術(shù)合作伙伴來(lái)實(shí)現(xiàn)您的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目嗎?
數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的關(guān)鍵角色
專(zhuān)案經(jīng)理
定義數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目及其可交付成果的范圍。
概述項(xiàng)目計(jì)劃,包括預(yù)算估算、項(xiàng)目資源和時(shí)間表。
管理日常數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目任務(wù)和活動(dòng)(資源協(xié)調(diào)、項(xiàng)目狀態(tài)跟蹤、項(xiàng)目進(jìn)度和溝通瓶頸等)
業(yè)務(wù)分析師
確定業(yè)務(wù)用戶(hù)的需求并確保將其清楚地傳達(dá)給技術(shù)團(tuán)隊(duì)。
進(jìn)行采訪(fǎng)并記錄下來(lái)。
協(xié)助數(shù)據(jù)建模師和DBA進(jìn)行數(shù)據(jù)建模、數(shù)據(jù)映射活動(dòng)等。
數(shù)據(jù)建模師
執(zhí)行詳細(xì)的數(shù)據(jù)分析。
設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的整體技術(shù)架構(gòu)以及具體的每個(gè)組件(數(shù)據(jù)暫存、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)模型等)。
監(jiān)督架構(gòu)開(kāi)發(fā)和實(shí)施。
就技術(shù)堆棧提供建議。
記錄整個(gè)解決方案及其組成部分的范圍。
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)管理員(DBA)
將邏輯模型轉(zhuǎn)換為物理表結(jié)構(gòu)。
確保數(shù)據(jù)庫(kù)的操作支持,調(diào)整數(shù)據(jù)庫(kù)性能以確保數(shù)據(jù)的可用性和完整性。
規(guī)劃數(shù)據(jù)備份/恢復(fù)計(jì)劃等。
ETL開(kāi)發(fā)人員
規(guī)劃、開(kāi)發(fā)和設(shè)置提取、轉(zhuǎn)化和裝載管道。
質(zhì)量保證工程師
制定測(cè)試策略以確保數(shù)據(jù)倉(cāng)庫(kù)的正常運(yùn)行和數(shù)據(jù)準(zhǔn)確性。
識(shí)別潛在錯(cuò)誤并確保其解決。
對(duì)開(kāi)發(fā)的DW解決方案進(jìn)行測(cè)試。
除了這些關(guān)鍵角色之外,其他專(zhuān)業(yè)人員也可能參與該項(xiàng)目,例如解決方案架構(gòu)師、技術(shù)支持專(zhuān)家、DevOps工程師、數(shù)據(jù)管理員、數(shù)據(jù)倉(cāng)庫(kù)培訓(xùn)師等。值得注意的是,有時(shí)個(gè)別工作人員可以扮演多種角色。
需要考慮的3種領(lǐng)先數(shù)據(jù)倉(cāng)庫(kù)技術(shù)
使用不適當(dāng)?shù)募夹g(shù)是數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目失敗的原因之一。除了需要正確識(shí)別應(yīng)用場(chǎng)景之外,還需要從市場(chǎng)上眾多看似相似的選項(xiàng)中選擇最佳的軟件。在這里,我們回顧了具有很高客戶(hù)滿(mǎn)意度、在各種市場(chǎng)研究報(bào)告中獲得高度評(píng)價(jià)并遵循數(shù)據(jù)倉(cāng)庫(kù)現(xiàn)代化原則的數(shù)據(jù)倉(cāng)庫(kù)服務(wù)和平臺(tái)。但所描述的功能并不詳盡:在制定其描述時(shí),我們主要關(guān)注其數(shù)據(jù)集成功能、與分析和商業(yè)智能服務(wù)的內(nèi)置連接、可靠性和數(shù)據(jù)安全性。
AmazonS3
提供聯(lián)合查詢(xún)功能以及與AmazonS3的內(nèi)置云數(shù)據(jù)集成,以跨操作數(shù)據(jù)庫(kù)和數(shù)據(jù)湖查詢(xún)和分析任何類(lèi)型、格式和大小的數(shù)據(jù)。
允許使用AWSDataPipeline、AWSDataMigrationServices、AWSGlue和AWSKinesisFirehose在AWS服務(wù)內(nèi)部和外部以流和批次方式提取和轉(zhuǎn)換數(shù)據(jù)。
提供與AWS分析服務(wù)(AWSLakeFormation、AmazonEMR、AmazonQuickSight、AmazonSageMaker等)的本機(jī)集成。
提供內(nèi)置的容錯(cuò)和災(zāi)難恢復(fù)功能(自動(dòng)集群快照、快照復(fù)制、持續(xù)集群監(jiān)控和替換等)。
通過(guò)表的精細(xì)權(quán)限、多因素用戶(hù)身份驗(yàn)證、數(shù)據(jù)加密等保護(hù)數(shù)據(jù)。
滿(mǎn)足SOC1、SOC2、SOC3、PCIDSSLevel1、HIPAA、ISO27001等合規(guī)性要求。
允許分離存儲(chǔ)和計(jì)算資源。
谷歌BigQuery
通過(guò)CloudFusion提供與150多個(gè)數(shù)據(jù)源的本機(jī)數(shù)據(jù)集成
提供多云分析支持(由GoogleBigQuery(Omni)提供),可跨AWS和Azure(即將推出)查詢(xún)數(shù)據(jù),而無(wú)需復(fù)制數(shù)據(jù)。
與Looker和整個(gè)GoogleCloudAnalytics生態(tài)系統(tǒng)的本機(jī)集成。
對(duì)冷數(shù)據(jù)和熱數(shù)據(jù)以及存儲(chǔ)和計(jì)算資源分別收費(fèi)。
默認(rèn)情況下,在多個(gè)位置免費(fèi)提供復(fù)制存儲(chǔ)。
提供對(duì)數(shù)據(jù)集、表、視圖、多因素用戶(hù)身份驗(yàn)證、數(shù)據(jù)加密(默認(rèn))等的精細(xì)權(quán)限。
滿(mǎn)足HIPAA、ISO27001、PCIDSS、SOC1、SOC2等合規(guī)性要求。
Azure
通過(guò)Azure數(shù)據(jù)工廠擁有95多個(gè)用于本地和云數(shù)據(jù)源的本機(jī)連接器。
通過(guò)AzureSynapseLink提供對(duì)本機(jī)HTAP的支持。
使用內(nèi)置的ApacheSpark和Azure流分析事件處理引擎支持大數(shù)據(jù)和流數(shù)據(jù)的引入和處理。
與PowerBI、Azure機(jī)器學(xué)習(xí)、Azure認(rèn)知服務(wù)、AzureDataLakeStorage等的本機(jī)集成。
允許單獨(dú)擴(kuò)展存儲(chǔ)和計(jì)算。
提供內(nèi)置的容錯(cuò)和災(zāi)難恢復(fù)功能(自動(dòng)快照、異地備份等)。
默認(rèn)數(shù)據(jù)安全功能(模式、表、視圖、單個(gè)列、過(guò)程等的細(xì)化權(quán)限、多因素用戶(hù)身份驗(yàn)證、數(shù)據(jù)加密等)。
滿(mǎn)足HIPAA、ISO27001、PCIDSS、SOC1、SOC2等合規(guī)性要求。
確保數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目成功的技巧
進(jìn)行敏捷數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)
數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)項(xiàng)目非常消耗時(shí)間和資源,因此選擇敏捷方法(這意味著通過(guò)增量投資將項(xiàng)目分解為迭代)盡早開(kāi)始獲得投資回報(bào),并最大限度地降低風(fēng)險(xiǎn)并避免大量的前期投資。
確保IT與業(yè)務(wù)之間的緊密合作
數(shù)據(jù)倉(cāng)庫(kù)的成功是IT和業(yè)務(wù)專(zhuān)家的共同努力,他們共同負(fù)責(zé)從收集業(yè)務(wù)需求到數(shù)據(jù)倉(cāng)庫(kù)部署和發(fā)布后支持的計(jì)劃。
關(guān)注最終用戶(hù)
為最終用戶(hù)提供可靠的支持文檔、培訓(xùn)和自助數(shù)據(jù)訪(fǎng)問(wèn)工具,確保數(shù)據(jù)倉(cāng)庫(kù)的高采用水平。
考慮專(zhuān)家建議
構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)通常需要將工作負(fù)載遷移到云,這并不容易,因?yàn)樗枰囟ǖ募寄芎蛯?zhuān)業(yè)知識(shí)。因此,當(dāng)開(kāi)始開(kāi)發(fā)項(xiàng)目時(shí),不要忽視向云遷移專(zhuān)家尋求建議。
小結(jié)
精心構(gòu)建的現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)可以幫助組織實(shí)現(xiàn)當(dāng)前的許多數(shù)據(jù)管理和分析目標(biāo),包括打破數(shù)據(jù)孤島、實(shí)時(shí)分析、交互式報(bào)告和受保護(hù)的企業(yè)數(shù)據(jù)。
- 上一篇
談?wù)勅绾谓⒖陕涞氐臄?shù)字化轉(zhuǎn)型戰(zhàn)略
數(shù)字化轉(zhuǎn)型戰(zhàn)略是指將數(shù)字技術(shù)集成到企業(yè)或組織的所有領(lǐng)域,從根本上改變其運(yùn)營(yíng)方式以及為客戶(hù)提供價(jià)值的方式。它涉及采用新技術(shù)并重新思考現(xiàn)有業(yè)務(wù)流程,以提高效率、生產(chǎn)力和客戶(hù)滿(mǎn)意度。
- 下一篇
預(yù)測(cè)分析初學(xué)者指南
長(zhǎng)期以來(lái),預(yù)測(cè)分析仍然是一個(gè)高度復(fù)雜的領(lǐng)域,只有數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師才能從事和利用;然而,得益于機(jī)器學(xué)習(xí)等人工智能技術(shù),現(xiàn)在即使是接受過(guò)最少培訓(xùn)的企業(yè)用戶(hù),也可以利用預(yù)測(cè)分析來(lái)分析歷史和當(dāng)前數(shù)據(jù),以獲得洞察,從而簡(jiǎn)化運(yùn)營(yíng)、降低風(fēng)險(xiǎn)并發(fā)現(xiàn)機(jī)會(huì)。