如何查找和解決數(shù)據(jù)中的盲點(diǎn)
您可以使用越來越多的工具來分析業(yè)務(wù)數(shù)據(jù)。但如果不考慮數(shù)據(jù)的盲點(diǎn),您可能不會對結(jié)果過于自信。沒有單一的方法可以做到這一點(diǎn),但我們將在這里研究一些可能性。首先要記住的是,盲點(diǎn)通常代表“未知的未知”。換句話說,這是一個(gè)你沒有考慮的因素,因?yàn)槟銢]有想過,也不知道,要考慮它。
1. 開始定位你的暗數(shù)據(jù)
當(dāng)許多業(yè)務(wù)分析師談?wù)摂?shù)據(jù)中的盲點(diǎn)時(shí),暗數(shù)據(jù)就會出現(xiàn)。暗數(shù)據(jù)也稱為“未分類數(shù)據(jù)”,它是您的企業(yè)擁有但不用于分析目的或與經(jīng)營業(yè)務(wù)相關(guān)的任何其他原因的信息。如果你不知道你的公司有多少暗數(shù)據(jù),它包含什么樣的信息,以及你的公司存儲它的位置,這種不了解可能會導(dǎo)致盲點(diǎn)。更具體地說,擁有過多的暗數(shù)據(jù)可能意味著您花費(fèi)更多時(shí)間搜索數(shù)據(jù)而不是分析數(shù)據(jù)?;蛘?,如果您無法在審計(jì)期間檢索到請求的信息,暗數(shù)據(jù)可能會使您的公司面臨監(jiān)管風(fēng)險(xiǎn)。同樣,一些暗數(shù)據(jù)包含黑客可能試圖獲取的敏感信息。如果他們成功了,您可能直到幾個(gè)月后才知道發(fā)生了數(shù)據(jù)泄露?如果有的話。幸運(yùn)的是,有專門的軟件選項(xiàng)可以發(fā)現(xiàn)您公司擁有的數(shù)據(jù)?黑暗還是其他?并清理它,以便您最終可以使用這些數(shù)據(jù)來滿足您的業(yè)務(wù)分析目標(biāo)。與其過分擔(dān)心該軟件所需的商業(yè)投資,不如想想如果您繼續(xù)忽視您的非機(jī)密數(shù)據(jù)及其造成的盲點(diǎn)會給您的公司帶來的風(fēng)險(xiǎn)。
2.注意存儲在手機(jī)和公共云中的數(shù)據(jù)
人們在工作日使用智能手機(jī)和平板電腦越來越普遍。如果他們參加實(shí)地考察或拜訪客戶,他們中的一些人會特別頻繁地這樣做。Vanson Bourne 為 Veritas 進(jìn)行了一項(xiàng)研究,以了解更多關(guān)于公司層面的暗數(shù)據(jù),并最終研究了移動數(shù)據(jù)等。研究結(jié)果揭示了幾個(gè)有趣的結(jié)論.首先,它表明,平均而言,組織內(nèi) 52% 的數(shù)據(jù)是未分類和未標(biāo)記的。Veritas 斷言此問題構(gòu)成安全風(fēng)險(xiǎn),因?yàn)樗節(jié)撛诘年P(guān)鍵業(yè)務(wù)信息容易被黑客竊取。研究還表明,存儲在移動設(shè)備上的數(shù)據(jù)特別有可能是未分類的。調(diào)查發(fā)現(xiàn),只有 6% 的受訪公司對存儲在移動設(shè)備上的所有數(shù)據(jù)進(jìn)行了分類。此外,67% 的人承認(rèn)他們對不到一半的移動設(shè)備數(shù)據(jù)進(jìn)行了分類。與存儲在公共云中的數(shù)據(jù)相關(guān)的其他有趣發(fā)現(xiàn)。對于想要解決盲點(diǎn)的公司來說,這是另一個(gè)弱點(diǎn)。只有 5% 的公司表示他們在公共云中沒有暗數(shù)據(jù),而 61% 的公司表示對不到一半的數(shù)據(jù)進(jìn)行了分類。
3. 克服確認(rèn)偏差造成的盲點(diǎn)
自然的人類行為也會導(dǎo)致特定于數(shù)據(jù)的盲點(diǎn)。例如,人們參加的第一堂數(shù)學(xué)課開始訓(xùn)練他們在收到的數(shù)據(jù)中尋找答案。但更好的方法是在他們尋找數(shù)據(jù)之前弄清楚要問哪些重要問題.那是因?yàn)?,如果人們已?jīng)期待一個(gè)特定的結(jié)論,例如支持他們假設(shè)的結(jié)論,他們將開始忽略與他們的期望不符的數(shù)據(jù)。上述現(xiàn)象稱為“確認(rèn)偏差”,它解釋了為什么人們?nèi)绱藞?jiān)定地抓住某些證據(jù),同時(shí)假裝其他證據(jù)不存在。因此,要有意識地避免陷入可能導(dǎo)致盲點(diǎn)的確認(rèn)偏差陷阱,您可以做的一件事是質(zhì)疑所有可用數(shù)據(jù)?即使它支持您希望看到的內(nèi)容。您不想?yún)⑴c重大疏忽,因?yàn)槟魂P(guān)注有利于您信念的數(shù)據(jù),而沒有考慮不利于您信念的信息。每當(dāng)您查看數(shù)據(jù)時(shí),問問自己:“有什么我想念的嗎?”或者“我應(yīng)該用另一種方式來解釋這個(gè)嗎?”強(qiáng)迫自己進(jìn)行批判性思考是一種實(shí)用的方法,可以避開您的思想試圖創(chuàng)造的盲點(diǎn)。
4. 用機(jī)器學(xué)習(xí)消除統(tǒng)計(jì)模型中的盲點(diǎn)
您的統(tǒng)計(jì)模型中也可能存在與數(shù)據(jù)相關(guān)的盲點(diǎn)。RiskSpan 是一家構(gòu)建機(jī)器學(xué)習(xí)算法的公司,該算法可以標(biāo)記統(tǒng)計(jì)模型中容易出錯(cuò)的部分,并指出哪些相關(guān)輸出可能不可靠。它還發(fā)現(xiàn),以這種方式應(yīng)用機(jī)器學(xué)習(xí)可以防止模型的準(zhǔn)確性隨著時(shí)間的推移而下降。這種使用機(jī)器學(xué)習(xí)的方式仍處于早期階段。但是,如果您懷疑盲點(diǎn)可能會影響您的統(tǒng)計(jì)模型的有效性,那么定制的機(jī)器學(xué)習(xí)算法可以幫助減少該問題。
5. 評估缺乏足夠的工具是否會造成盲點(diǎn)
如果您的公司沒有適當(dāng)衡量投資回報(bào)率的必要工具,它也可能有需要克服的盲點(diǎn)。DialogTech 的 2015 年信息圖認(rèn)為如果營銷人員缺乏跟蹤點(diǎn)擊通話客戶的投資回報(bào)率 (ROI) 的方法,他們可能會遇到盲點(diǎn)?那些在他們的移動設(shè)備上獲取公司信息,然后直接打電話給他們的人。DialogTech 的統(tǒng)計(jì)數(shù)據(jù)顯示,只有 21% 的公司認(rèn)為自己能夠有效衡量移動投資回報(bào)率。數(shù)據(jù)還顯示,到 2019 年,將有 1620 億通電話來自最初在移動渠道上遇到公司的人。移動搜索和社交媒體是此類活動的主要驅(qū)動力。此外,當(dāng)營銷人員可以計(jì)算移動投資回報(bào)率時(shí),每條線索的成本指標(biāo)下降了 100 多美元。這是因?yàn)樗麄兛梢詼?zhǔn)確地了解哪些線索來自移動設(shè)備,哪些來自其他渠道,然后相應(yīng)地調(diào)整他們的支出。旨在考慮您的公司是否可能存在盲點(diǎn),因?yàn)樗鼪]有盡可能好地跟蹤潛在客戶,或者您的工具是否在其他方面存在不足。進(jìn)行內(nèi)部調(diào)查以找出工作人員希望他們可以衡量的數(shù)據(jù)類型是找到盲點(diǎn)并確定如何投資資源以最大限度地減少盲點(diǎn)的堅(jiān)實(shí)起點(diǎn)。
消除盲點(diǎn)對企業(yè)有利
現(xiàn)在應(yīng)該很明顯為什么采取措施發(fā)現(xiàn)和消除盲點(diǎn)具有良好的商業(yè)意義。在處理數(shù)據(jù)時(shí),您越了解潛在的盲點(diǎn),就越容易對結(jié)果充滿信心 ?在向上級或決策者展示數(shù)據(jù)時(shí),您會感覺自己更有能力。
- 上一篇
納米級3D打印越來越接近現(xiàn)實(shí)
納米級 3D 打印是 3D 打印以納米為單位測量的物體的能力。例如,1 毫米中有 1,000,000 納米。為了更好地了解大小或缺乏大小,我們應(yīng)該參考一根頭發(fā)的大小,其直徑為 75,000-100,0
- 下一篇
作為數(shù)據(jù)科學(xué)家成功的秘訣是什么?
數(shù)據(jù)科學(xué)領(lǐng)域正在快速發(fā)展,這就產(chǎn)生了對更多數(shù)據(jù)科學(xué)家加入該行業(yè)的巨大需求。但在如此多的競爭中,問題是,你如何脫穎而出并獲得成功?了解數(shù)據(jù)科學(xué)家的角色這個(gè)詞經(jīng)常被拋棄,但數(shù)