模型漂移:解釋AI的致命弱點(diǎn)
機(jī)器學(xué)習(xí)模型是從數(shù)據(jù)中學(xué)習(xí)的一組規(guī)則的數(shù)學(xué)表示。它是訓(xùn)練機(jī)器學(xué)習(xí)算法過程的輸出。然后使用該模型根據(jù)新的、看不見的數(shù)據(jù)做出預(yù)測(cè)或決策。
有許多不同類型的機(jī)器學(xué)習(xí)模型
您需要熟悉許多不同類型的機(jī)器學(xué)習(xí),包括決策樹、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)。每種類型的模型都有自己的優(yōu)點(diǎn)和缺點(diǎn),適用于不同類型的任務(wù)。
要?jiǎng)?chuàng)建機(jī)器學(xué)習(xí)模型,您需要為算法提供一組訓(xùn)練數(shù)據(jù)。然后,該算法使用此數(shù)據(jù)以及一組稱為學(xué)習(xí)算法的規(guī)則來了解數(shù)據(jù)中的關(guān)系和模式。生成的模型是一組捕捉這些模式的數(shù)學(xué)方程式,可用于根據(jù)新的、看不見的數(shù)據(jù)做出預(yù)測(cè)或決策。
什么是模型漂移?
模型漂移是指機(jī)器學(xué)習(xí)模型的性能由于其作為輸入的數(shù)據(jù)在現(xiàn)實(shí)世界中發(fā)生變化而隨著時(shí)間的推移而下降。模型漂移主要有兩種類型:
當(dāng)數(shù)據(jù)中的關(guān)系或模式隨時(shí)間發(fā)生變化時(shí),就會(huì)發(fā)生概念漂移。例如,考慮一個(gè)經(jīng)過訓(xùn)練可以預(yù)測(cè)信用卡欺詐的機(jī)器學(xué)習(xí)模型。該模型可能會(huì)在包含一定比例的欺詐和非欺詐交易的數(shù)據(jù)集上進(jìn)行訓(xùn)練。如果欺詐交易的比例隨時(shí)間發(fā)生變化,模型的性能可能會(huì)下降,因?yàn)樗辉倌軌蚋鶕?jù)新的數(shù)據(jù)分布準(zhǔn)確預(yù)測(cè)結(jié)果。
當(dāng)數(shù)據(jù)本身隨時(shí)間發(fā)生變化時(shí),就會(huì)發(fā)生數(shù)據(jù)漂移。例如,考慮一個(gè)機(jī)器學(xué)習(xí)模型,該模型經(jīng)過訓(xùn)練可以對(duì)動(dòng)物圖像進(jìn)行分類。如果該模型是在包含狗、貓和鳥的圖像的數(shù)據(jù)集上訓(xùn)練的,它可能在這些動(dòng)物的新圖像上表現(xiàn)良好。然而,如果隨后向模型展示一種它以前從未見過的新型動(dòng)物,例如海豚,它可能表現(xiàn)不佳,因?yàn)樗?xùn)練的數(shù)據(jù)不包括任何海豚的例子。
減輕漂移影響的一種方法是定期根據(jù)新數(shù)據(jù)重新訓(xùn)練模型,以確保它保持準(zhǔn)確和最新。詳細(xì)了解此技術(shù)深度 ML 模型,漂移(aporia dotcom;漂移的概念)。
模型漂移如何影響生產(chǎn)AI系統(tǒng)?
模型漂移會(huì)對(duì)生產(chǎn) AI 系統(tǒng)產(chǎn)生重大影響,因?yàn)樗鼤?huì)導(dǎo)致它們做出不準(zhǔn)確的預(yù)測(cè)或分類。這可能會(huì)導(dǎo)致性能不佳和潛在的有害決策。在某些情況下,它可能會(huì)導(dǎo)致系統(tǒng)故障,造成經(jīng)濟(jì)損失甚至人身傷害。
在生產(chǎn)人工智能系統(tǒng)中,模型漂移可能是由于輸入數(shù)據(jù)分布隨時(shí)間的變化而發(fā)生的,例如客戶行為或市場(chǎng)條件的變化。它也可能由于系統(tǒng)本身的變化而發(fā)生,例如硬件或軟件的更新。
為了減輕模型漂移的影響,定期監(jiān)控 AI 系統(tǒng)的性能并根據(jù)需要重新訓(xùn)練模型非常重要。主動(dòng)學(xué)習(xí)和在線學(xué)習(xí)等技術(shù)也可用于使模型不斷適應(yīng)輸入數(shù)據(jù)的變化。此外,使用組合多個(gè)模型的集成方法可能是有益的,因?yàn)檫@有助于減少模型漂移的影響。
充分了解底層數(shù)據(jù)和系統(tǒng)以檢測(cè)任何漂移跡象并采取必要的措施(例如重新訓(xùn)練模型、微調(diào)參數(shù)或收集更多數(shù)據(jù))也很重要。
鑒于模型漂移問題,我們可以信任人工智能嗎?
在使用人工智能 (AI) 系統(tǒng)時(shí),了解模型漂移的可能性很重要,因?yàn)樗鼤?huì)影響模型做出的預(yù)測(cè)或決策的準(zhǔn)確性和可靠性。然而,這并不一定意味著人工智能系統(tǒng)不可信。
關(guān)鍵是接受和管理機(jī)器學(xué)習(xí)模型中固有的風(fēng)險(xiǎn)。這被稱為“模型風(fēng)險(xiǎn)”——機(jī)器學(xué)習(xí)模型可能做出錯(cuò)誤預(yù)測(cè)或決策的風(fēng)險(xiǎn),這可能對(duì)其所有者或用戶產(chǎn)生負(fù)面影響。
例如,以房地產(chǎn)和租賃市場(chǎng) Zillow 為例。到2021年,由于財(cái)產(chǎn)估值算法高估了房地產(chǎn)價(jià)值,導(dǎo)致公司在購房時(shí)過度投資,導(dǎo)致其累計(jì)損失超過 5 億美元。因此,該公司不得不裁員。
Zillow 可能在推出機(jī)器學(xué)習(xí)模型之前實(shí)施了嚴(yán)格的測(cè)試。生產(chǎn)中的推出是漸進(jìn)的,使公司能夠評(píng)估其在現(xiàn)實(shí)世界中的表現(xiàn)。然而,該公司隨即在市場(chǎng)條件開始發(fā)生變化(概念漂移)時(shí)在短時(shí)間內(nèi)擴(kuò)大了采購計(jì)劃。因此,該模型不再反映房地產(chǎn)市場(chǎng)。
這說明了為什么公司主動(dòng)管理模型風(fēng)險(xiǎn)以確保他們的機(jī)器學(xué)習(xí)系統(tǒng)做出準(zhǔn)確的預(yù)測(cè)或決策很重要。如果 Zillow 更密切地監(jiān)控模型,模型漂移的影響是可以避免的。
AI開發(fā)人員可以對(duì)漂移做些什么
AI開發(fā)人員可以采取多種措施來減輕模型漂移的影響:
定期在新數(shù)據(jù)上重新訓(xùn)練模型:確保模型保持準(zhǔn)確和最新的一種方法是定期在新數(shù)據(jù)上重新訓(xùn)練它。這有助于減少概念漂移和數(shù)據(jù)漂移的影響。
使用在線學(xué)習(xí)等技術(shù):在線學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,它允許模型在新數(shù)據(jù)可用時(shí)不斷自我更新。這有助于減少概念漂移和數(shù)據(jù)漂移的影響。
監(jiān)控模型的性能:模型在生產(chǎn)環(huán)境中部署后,持續(xù)監(jiān)控其性能以確保其仍在做出準(zhǔn)確的預(yù)測(cè)或決策非常重要。這有助于識(shí)別數(shù)據(jù)分布的任何變化或可能導(dǎo)致模型漂移的其他因素。監(jiān)測(cè)應(yīng)該是一個(gè)持續(xù)的過程。
使用多個(gè)模型:使用多個(gè)模型有助于降低依賴單個(gè)模型可能會(huì)出現(xiàn)模型漂移的風(fēng)險(xiǎn)。通過組合多個(gè)模型的預(yù)測(cè)或決策,可以提高系統(tǒng)的整體性能。
添加人工監(jiān)督:在某些情況下,使用人工監(jiān)督來審查或驗(yàn)證模型做出的預(yù)測(cè)或決策可能是合適的。這有助于確保正確使用系統(tǒng)并解決任何潛在問題。
結(jié)論
總之,模型漂移是一種隨著時(shí)間的推移會(huì)顯著影響人工智能 (AI) 系統(tǒng)性能的現(xiàn)象。當(dāng)訓(xùn)練模型的數(shù)據(jù)分布或數(shù)據(jù)關(guān)系發(fā)生變化,導(dǎo)致模型的準(zhǔn)確性和可靠性下降時(shí),就會(huì)發(fā)生這種情況。
概念漂移和數(shù)據(jù)漂移都很難管理,因?yàn)樗鼈冸y以預(yù)測(cè)和檢測(cè)。然而,通過采取諸如定期根據(jù)新數(shù)據(jù)重新訓(xùn)練模型、使用在線學(xué)習(xí)技術(shù)和使用多個(gè)模型等步驟,AI 開發(fā)人員可以減輕模型漂移的影響并提高其系統(tǒng)的可信度。
- 上一篇
初創(chuàng)企業(yè)應(yīng)了解的基本物聯(lián)網(wǎng)安全概念
物聯(lián)網(wǎng) (IoT) 正在徹底改變我們的生活和工作方式,將日常設(shè)備連接到互聯(lián)網(wǎng),并實(shí)現(xiàn)前所未有的自動(dòng)化和便利程度。然而,隨著連接性的增加,安全風(fēng)險(xiǎn)也隨之增加。隨著物聯(lián)網(wǎng)設(shè)備收集
- 下一篇
規(guī)劃IT預(yù)算時(shí)要考慮的3個(gè)關(guān)鍵云計(jì)算趨勢(shì)
在新的一年里,IT預(yù)算規(guī)劃是企業(yè)領(lǐng)導(dǎo)者的頭等大事。大流行推動(dòng)了遠(yuǎn)程工作的采用,促使許多企業(yè)投資于新的或擴(kuò)展現(xiàn)有的IT解決方案以維持生計(jì)。雖然一些決定最初被認(rèn)為是暫時(shí)的,但