數據分析,根本沒有你想的那么高級!
在數字化轉型工作中,十分強調通過數據科學技術來發(fā)揮數據的價值,例如通過數據分析方法,從數據中提取出有價值的業(yè)務信息,以此來提供有效的業(yè)務應用或業(yè)務決策。在數字經濟大趨勢下,數據分析這件事,突然之間地位得到了前所未有的提升。
當前,為了迎合數字化的迫切需求,數據分析似乎成為一種非常有潛力的技術能力。如果一個業(yè)務人員懂得如何做好數據分析,或者說,掌握更豐富的數據分析方法和經驗,那么他似乎也更具職場優(yōu)勢。
然而,事實確實是這樣嗎?
在開始從事數字化轉型,或者,牽頭數字化項目時,經常會覺得數據分析技術能力很重要,然而,隨著實踐經驗不斷積累,接觸的項目多了,逐漸發(fā)現,數據分析這件事變得有點“雞肋”。
尤其是在技術層面,總覺得被一些外在的因素“卡脖子”,由于這些因素的存在,縱然有很多“絕世武功”可以拿出來過招,但似乎很少有機會真正發(fā)揮出這些技術方面的優(yōu)勢。
因此,最終得到結論——在數字化轉型工作中,數據分析或許并沒有想象的那么高級。
一般來說,數據分析有兩種典型的應用場景。一是了解現狀,二是發(fā)現未知。
而各種復雜的數據分析技術,以及相應的數據建模方法,基本上都是為了解決第二類需求,即發(fā)現未知,無論是未知的業(yè)務知識、規(guī)律,還是未知的猜測場景,或未來趨勢。
比較尷尬的事實是,在企業(yè)數字化實踐中,我們經常發(fā)現,大多數的數據是用來解決第一類需求,即了解現狀。
在數字化應用中,往往不需要過多“花哨”的技術手段,如果你問業(yè)務人員需要什么,或者問領導想從數據中看到什么,大多數的回答基本上都是——某某數據統計結果能夠及時、準確地反饋就好了。最多再來個可視化。
不需要建模么?不需要預測未知么?僅此而已?
當然需要,但是這些更高級的需求,其實業(yè)務部門對“數字化”的期待并不高。
除了在工業(yè)自動化相關領域,如智能制造或智慧城市中的全機器驅動場景,大多數企業(yè)在從數據資源中推斷、判斷業(yè)務情況,以及進行決策活動,還仍然遵循著傳統的人工方式。
在數字化建設中,除了“取數”、“統計”,對于業(yè)務人員來說,其他需求似乎都不那么迫切。
在進行業(yè)務判斷和決策時,采用機器建模的方式,被認為不那么可靠。
當然,導致這種結果的原因一方面可能是數據科學家并不那么了解業(yè)務,總是構建出華而不實的數據模型;另一方面可能對于一些綜合的、“非線性”的業(yè)務問題,需要考慮的因素和關系也確實太復雜,即便是業(yè)務人員自己,對問題的結構化難度以及建模難度很大。
最終,業(yè)務人員選擇出靠譜、順手的一種數字化應用模式就是:機器來取數,整合信息,人(靠經驗)來進行分析。這時,數字化應用從外表看是在做數據分析,而這種分析只是非常淺層的分析,或者說,最多只能算是數據查詢、數據統計。
最終,數字化應用需求,大多數都退化為,以“取數”為中心的數字化能力建設。這類需求,在算法上沒什么難度,技術創(chuàng)新空間不大,而為了保證“取數”的質量,技術人員又要花費大量的精力對平臺進行性能上的優(yōu)化,這屬于“純粹”工程上的事情,再不然,就是投入更多的人力來進行數據治理,保證“取”到的數據結果可靠。
數據分析,沒有什么算法,也沒有什么模型。即使有,也只是一些在業(yè)務上預定義的函數、規(guī)則、指標。
單純數據驅動的方式得到有價值的結論,這看似是經典的案例場景,但其實卻是數字化的未來理想狀態(tài),目前在大多數行業(yè)的數字產業(yè)實踐中,并不太普及,也不太適用。
未來,數字化應用需要逐漸從以人工分析為主,過渡到以數據分析為主的形態(tài),不斷加大自動化、智能化要素比例。很多數據分析技術,在數據科學理論上都具有很優(yōu)質的應用性能基礎,因此要創(chuàng)造更有利的條件來促進產業(yè)中的深度數據分析活動實踐,具體包括:
- 推動業(yè)務知識的數字化編碼,加大數據庫、知識庫、案例庫的數字化建設;
- 以有經驗的業(yè)務人員牽頭,進行產業(yè)數據模型的研究和開發(fā);
- 加強數據治理工作,逐步提高數據資源的可用性;
- 研究具有可解釋性的、更加“魯棒”的數據模型,提高數據模型的適應性、可調節(jié)性;
- 推動數據部門和業(yè)務部門的工作協同,推動跨領域之間的數據共享和數據融合;
- 推動數據平臺建設,低代碼平臺建設,降低業(yè)務人員主動參與數據建模與分析的技術門檻。