應(yīng)用AI和MLOps的成長階段
圖片來源:123RF
在麥肯錫公司的“2022年技術(shù)趨勢(shì)展望”報(bào)告中,應(yīng)用人工智能位居14種最具影響力的技術(shù)趨勢(shì)之首。
目前,應(yīng)用人工智能(也可以稱為“企業(yè)人工智能”)主要是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型在實(shí)際應(yīng)用中的使用。進(jìn)入麥肯錫前14名的一個(gè)密切相關(guān)的趨勢(shì)是“機(jī)器學(xué)習(xí)工業(yè)化”,它指的是MLOps平臺(tái)和其他工具,它們可以更容易地在不同的應(yīng)用程序和環(huán)境中訓(xùn)練、部署、集成和更新ML模型。
麥肯錫的調(diào)查結(jié)果與咨詢和研究公司發(fā)布的類似報(bào)告一致,表明經(jīng)過十年的投資、研究和工具開發(fā),應(yīng)用人工智能的障礙正在慢慢消失。
大型科技公司通常擁有許多頂尖的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)科學(xué)家和工程師,多年來一直在研究新算法并將其應(yīng)用到他們的產(chǎn)品中。由于麥肯錫報(bào)告中強(qiáng)調(diào)的發(fā)展,更多的組織可以在他們的應(yīng)用程序中采用機(jī)器學(xué)習(xí)模型,并為他們的客戶和用戶帶來好處。
應(yīng)用機(jī)器學(xué)習(xí)的挑戰(zhàn)
近十年來,人們對(duì)人工智能的主流興趣得到了復(fù)蘇和增長,這主要?dú)w功于深度神經(jīng)網(wǎng)絡(luò)在執(zhí)行以前被認(rèn)為超出計(jì)算機(jī)限制的任務(wù)方面的成熟能力。在同一時(shí)期,機(jī)器學(xué)習(xí)研究界在人工智能的一些具有挑戰(zhàn)性的領(lǐng)域取得了令人矚目的進(jìn)展,包括計(jì)算機(jī)視覺和自然語言處理。
由于收集、存儲(chǔ)和訪問不同領(lǐng)域數(shù)據(jù)的能力不斷增強(qiáng),機(jī)器學(xué)習(xí)的科學(xué)突破在很大程度上成為可能。與此同時(shí),處理器和云計(jì)算的進(jìn)步使得以以前被認(rèn)為不可能的速度和規(guī)模訓(xùn)練和運(yùn)行神經(jīng)網(wǎng)絡(luò)成為可能。
深度學(xué)習(xí)的一些里程碑式的成就緊隨其后的是宣傳(并且經(jīng)常夸大)當(dāng)代人工智能能力的新聞周期。今天,許多公司試圖將自己標(biāo)榜為“人工智能優(yōu)先”,或者將他們的產(chǎn)品宣傳為使用了最新最好的深度學(xué)習(xí)。
然而,將ML從研究實(shí)驗(yàn)室?guī)У綄?shí)際產(chǎn)品會(huì)帶來一些挑戰(zhàn),這就是大多數(shù)機(jī)器學(xué)習(xí)策略失敗的原因. 創(chuàng)建和維護(hù)使用機(jī)器學(xué)習(xí)的產(chǎn)品需要與傳??統(tǒng)軟件中使用的不同的基礎(chǔ)架構(gòu)、工具和技能集。組織需要數(shù)據(jù)湖來收集和存儲(chǔ)數(shù)據(jù),需要數(shù)據(jù)工程師來設(shè)置、維護(hù)和配置數(shù)據(jù)基礎(chǔ)設(shè)施,以便訓(xùn)練和更新ML模型。他們需要數(shù)據(jù)科學(xué)家和ML工程師來準(zhǔn)備為其應(yīng)用程序提供動(dòng)力的數(shù)據(jù)和模型。他們需要分布式計(jì)算專家,這些專家可以使ML模型以時(shí)間和成本高效的方式大規(guī)模運(yùn)行。他們需要能夠使ML系統(tǒng)適應(yīng)他們的業(yè)務(wù)模型的產(chǎn)品經(jīng)理和能夠?qū)L管道集成到他們的產(chǎn)品中的軟件工程師。
企業(yè)AI帶來的數(shù)據(jù)、硬件和人才成本對(duì)于小型組織而言往往過于高昂,無法對(duì)ML戰(zhàn)略進(jìn)行長期投資。
正是在這種背景下,麥肯錫公司報(bào)告的調(diào)查結(jié)果值得研究。
應(yīng)用人工智能的增長
該報(bào)告根據(jù)五個(gè)可量化的指標(biāo)對(duì)技術(shù)趨勢(shì)進(jìn)行排名:搜索引擎查詢、新聞出版物、專利、研究出版物和投資。值得注意的是,這樣的量化指標(biāo)并不總是能最準(zhǔn)確地描繪出趨勢(shì)的相關(guān)性。但是隨著時(shí)間的推移跟蹤它們可以很好地估計(jì)一項(xiàng)技術(shù)如何通過炒作、采用和生產(chǎn)力周期的不同步驟。
麥肯錫通過對(duì)來自20個(gè)不同行業(yè)的專家的調(diào)查和訪談進(jìn)一步證實(shí)了其調(diào)查結(jié)果,從而更好地了解了機(jī)遇和挑戰(zhàn)。
該報(bào)告基于2018-2021年的數(shù)據(jù),并不能完全解釋資本市場目前正在經(jīng)歷的低迷。根據(jù)調(diào)查結(jié)果,除了“搜索引擎查詢”??類別(這是一個(gè)灰色區(qū)域,因?yàn)槿斯ぶ悄苄g(shù)語和趨勢(shì)在不斷發(fā)展)之外,應(yīng)用人工智能在所有可量化的指標(biāo)中都出現(xiàn)了增長。麥肯錫在2021年以1650億美元的價(jià)格為應(yīng)用人工智能提供了最高的創(chuàng)新分?jǐn)?shù)和前五名的投資分?jǐn)?shù)。
(衡量投資也是非常主觀的,取決于你如何定義“應(yīng)用人工智能”——例如,如果一家獲得巨額資金的公司將機(jī)器學(xué)習(xí)作為其產(chǎn)品的一小部分,它是否算作對(duì)應(yīng)用人工智能的投資?)
在行業(yè)相關(guān)性方面,報(bào)告中提到的部分機(jī)器學(xué)習(xí)應(yīng)用包括推薦引擎(如內(nèi)容推薦、智能追加銷售)、檢測(cè)與預(yù)防(如信用卡欺詐檢測(cè)、客戶投訴建模、疾病早期診斷)等用例、缺陷預(yù)測(cè))和時(shí)間序列分析(例如,管理價(jià)格波動(dòng)、需求預(yù)測(cè))。有趣的是,這些是機(jī)器學(xué)習(xí)的一些領(lǐng)域,這些領(lǐng)域的算法已經(jīng)發(fā)展了多年。盡管計(jì)算機(jī)視覺在用例中只提到過一次,但一些應(yīng)用程序可能會(huì)從中受益(例如,文檔掃描、設(shè)備缺陷檢測(cè))。
該報(bào)告還提到了機(jī)器學(xué)習(xí)的一些更先進(jìn)的領(lǐng)域,例如生成深度學(xué)習(xí)模型(例如,用于自動(dòng)駕駛汽車的模擬引擎、生成化合物)、變壓器模型(例如,藥物發(fā)現(xiàn))、圖神經(jīng)網(wǎng)絡(luò)和機(jī)器人技術(shù)。
這進(jìn)一步說明了采用應(yīng)用人工智能的主要障礙不是糟糕的機(jī)器學(xué)習(xí)算法,而是缺乏工具和基礎(chǔ)設(shè)施來有效使用眾所周知的和經(jīng)過測(cè)試的算法。這些限制將應(yīng)用人工智能限制在沒有大量資源和稀缺機(jī)器學(xué)習(xí)人才的公司中。
近年來,在其中一些方面取得了巨大進(jìn)展。我們已經(jīng)看到了無代碼機(jī)器學(xué)習(xí)平臺(tái)、易于使用的機(jī)器學(xué)習(xí)編程庫、基于API的機(jī)器學(xué)習(xí)服務(wù)(MLaaS)以及用于訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型的特殊硬件的出現(xiàn)和成熟。與此同時(shí),ML服務(wù)底層的數(shù)據(jù)存儲(chǔ)技術(shù)已經(jīng)發(fā)展為更加靈活、可互操作和可擴(kuò)展。與此同時(shí),一些企業(yè)AI公司已經(jīng)開始為特定行業(yè)(例如,金融服務(wù)、石油和天然氣、零售)開發(fā)和提供ML解決方案。
所有這些發(fā)展都減少了在其商業(yè)模式中采用機(jī)器學(xué)習(xí)的財(cái)務(wù)和技術(shù)障礙。在許多情況下,公司可以將ML服務(wù)集成到他們的應(yīng)用程序中,而無需深入了解后臺(tái)運(yùn)行的算法。
根據(jù)麥肯錫2021年對(duì)行業(yè)專家的調(diào)查,“56%的受訪者表示他們的組織已采用人工智能,高于2020年調(diào)查的50%。2021年的調(diào)查還表明,采用人工智能可以帶來經(jīng)濟(jì)利益:27%的受訪者將其公司5%或更多的息稅前利潤歸因于人工智能。”
MLOps的進(jìn)展
麥肯錫公司報(bào)告中包含的第二個(gè)與人工智能相關(guān)的技術(shù)趨勢(shì)是“機(jī)器學(xué)習(xí)的工業(yè)化”。這是一個(gè)模糊的術(shù)語,與應(yīng)用的AI類別有很多重疊,因此該報(bào)告將其定義為“一個(gè)可互操作的技術(shù)工具堆棧,用于自動(dòng)化ML并擴(kuò)大其使用范圍,以便組織能夠充分發(fā)揮其潛力。”
該領(lǐng)域進(jìn)步的基礎(chǔ)技術(shù)與導(dǎo)致應(yīng)用AI增長的技術(shù)基本相同(更好的數(shù)據(jù)存儲(chǔ)平臺(tái)、硬件堆棧、ML開發(fā)工具和平臺(tái)等)。然而,近年來取得令人矚目發(fā)展的一個(gè)特定領(lǐng)域是機(jī)器學(xué)習(xí)操作(MLOps),這是一套簡化ML模型的訓(xùn)練、部署和維護(hù)的工具和實(shí)踐。
MLOps平臺(tái)提供用于管理、處理和標(biāo)記數(shù)據(jù)的工具;訓(xùn)練和比較不同的機(jī)器學(xué)習(xí)模型;數(shù)據(jù)集和模型的版本控制;部署ML模型并監(jiān)控其性能;隨著性能下降、環(huán)境變化和新數(shù)據(jù)可用時(shí)更新ML模型。MLOps平臺(tái)的數(shù)量和成熟度都在增長,它匯集了以前以臨時(shí)方式拼命執(zhí)行的幾個(gè)不同任務(wù)。
根據(jù)該報(bào)告,機(jī)器學(xué)習(xí)的產(chǎn)業(yè)化“可以將ML應(yīng)用程序的生產(chǎn)時(shí)間縮短90%(從概念驗(yàn)證到產(chǎn)品),并將開發(fā)資源減少多達(dá)40%。”
企業(yè)AI仍面臨挑戰(zhàn)
盡管應(yīng)用人工智能取得了進(jìn)展,但該領(lǐng)域仍有一些差距需要彌補(bǔ)。麥肯錫報(bào)告指出,人才和資金等資源的可用性仍然是企業(yè)AI進(jìn)一步發(fā)展的兩個(gè)障礙。目前,資本市場處于低迷狀態(tài),包括人工智能在內(nèi)的所有行業(yè)都面臨著為初創(chuàng)公司和公司提供資金的問題。
然而,盡管人工智能的資本蛋糕越來越小,但資金并沒有完全停止。根據(jù)CB Insights最近的一份報(bào)告,已經(jīng)實(shí)現(xiàn)產(chǎn)品/市場契合并準(zhǔn)備好積極增長的公司仍在設(shè)法獲得巨額融資(超過1億美元)。這表明,沒有利潤推出新的機(jī)器學(xué)習(xí)戰(zhàn)略的公司將很難獲得外部資金。但已經(jīng)占據(jù)市場份額的應(yīng)用ML平臺(tái)將繼續(xù)吸引投資者的興趣。
報(bào)告提到的另一個(gè)重要挑戰(zhàn)是數(shù)據(jù)風(fēng)險(xiǎn)和漏洞。對(duì)于應(yīng)用機(jī)器學(xué)習(xí)來說,這正成為一個(gè)越來越重要的問題。與其開發(fā)生命周期一樣,機(jī)器學(xué)習(xí)的安全威脅格局也不同于傳統(tǒng)軟件。大多數(shù)軟件開發(fā)平臺(tái)中使用的安全工具并非旨在檢測(cè)對(duì)抗性示例、數(shù)據(jù)中毒、成員推理攻擊和其他類型的針對(duì)ML模型的威脅。
幸運(yùn)的是,安全和機(jī)器學(xué)習(xí)社區(qū)正在共同開發(fā)用于創(chuàng)建安全ML管道的工具和實(shí)踐。隨著應(yīng)用人工智能的持續(xù)增長,我們可以期待其他行業(yè)加快采用機(jī)器學(xué)習(xí),這反過來將進(jìn)一步加快該領(lǐng)域的創(chuàng)新步伐。
- 上一篇
物理學(xué)突破可能創(chuàng)造更高效的量子計(jì)算機(jī)
馬克斯普朗克量子光學(xué)研究所的一組科學(xué)家最近展示了一項(xiàng)破紀(jì)錄的實(shí)驗(yàn),該實(shí)驗(yàn)可能會(huì)顛覆量子計(jì)算行業(yè)。量子激流回旋當(dāng)今STEM研究人員面臨的最大挑戰(zhàn)之一是難以構(gòu)建容錯(cuò)、穩(wěn)定
- 下一篇
人工智能幫助自動(dòng)化稅務(wù)合規(guī)程序
人工智能技術(shù)在許多方面幫助公司提高了盈利能力和效率。根據(jù)大多數(shù)調(diào)查,最成功的公司中有90%在某種程度上使用了人工智能。人工智能最有益的應(yīng)用之一是在稅收合規(guī)領(lǐng)域。您可