云VS本地:誰是生成式人工智能主導(dǎo)的未來戰(zhàn)場?
企業(yè)客戶的數(shù)據(jù)明確但存在沖突。盡管有94%的客戶表示他們今年在人工智能上的投入更多,但由于預(yù)算的限制,這將會削減在其他項目的投入。此外,關(guān)于在哪里運行生成式AI的問題,客戶幾乎完全分為公共云和本地/邊緣計算兩派。讓問題變得更加復(fù)雜的是,開發(fā)人員稱公共云在功能豐富性和創(chuàng)新速度方面的體驗非常出色,然而知識產(chǎn)權(quán)泄露、合規(guī)性、法律風(fēng)險和成本等問題將限制組織機構(gòu)對公共云的使用。
在這份報告中,我們將分享關(guān)于大型語言模型采用情況的最新數(shù)據(jù)和思考,以及影響市場發(fā)展的因素。與往常一樣,我們將分享最新的ETR數(shù)據(jù),以揭示客戶在平衡風(fēng)險和價值實現(xiàn)時間方面所面臨的關(guān)鍵問題。
企業(yè)IT支出仍然緊縮
下面的圖表是最新的ETR支出快照中的數(shù)據(jù)。該數(shù)據(jù)包括1,777名高級IT決策者,代表了超過7500億美元的支出能力。
高級IT決策者們在2022年結(jié)束時期望他們的預(yù)算能增加4-5%。但到了一月份,這個數(shù)字反而下降了4.1%,盡管在今年的各個時間段都有小幅度的增長,但目前仍然只增長了2.9%,遠(yuǎn)低于最初的預(yù)期。
預(yù)算限制迫使進(jìn)行權(quán)衡
在預(yù)算有限的情況下,生成式AI的迅速發(fā)展導(dǎo)致組織機構(gòu)不得不重新設(shè)置優(yōu)先級。正如我們在去年與Andy Thurai進(jìn)行的分析中所分享的那樣,人工智能投資回報一直難以捉摸。但ChatGPT熱潮促使董事會下達(dá)了一項自上而下的命令,并因此改變了企業(yè)技術(shù)方面的支出重點。
上圖顯示了ETR追蹤的行業(yè)。凈分?jǐn)?shù)或支出動力位于縱軸上,調(diào)查中的普及度位于橫軸上。雖然所有行業(yè)在2022年都感受到了預(yù)算限制的壓力,但AI作為領(lǐng)先的細(xì)分市場之一,到了2022年10月,被壓縮到低于40%的紅色虛線——即支出速度的高水位線。ChatGPT在11月份進(jìn)入市場后,AI支出加速增長。然而,預(yù)算并沒有發(fā)生明顯變化。
因此,我們看到其他行業(yè)出現(xiàn)了壓縮的情況,這表明在短期內(nèi),對生成式AI的資金投入將對市場的其他細(xì)分領(lǐng)域產(chǎn)生一定程度的稀釋效應(yīng)。
對AI的支出超過其他項目
正如我們之前提到的,在下面的數(shù)據(jù)中顯示,94% 的客戶報告稱他們將在2023年增加他們在AI上的支出。
盡管大多數(shù)客戶報告稱其支出增長幅度為10%或更低,但有36%的客戶表示他們的支出將增長兩位數(shù)。
高層領(lǐng)導(dǎo)的要求與風(fēng)險偏好相沖突
來自高層自上而下的壓力要求企業(yè)“搞清楚”生成式AI,這是一項緊迫的任務(wù),實際執(zhí)行起來更具有挑戰(zhàn)性。下圖顯示了客戶在生產(chǎn)環(huán)境中如何使用生成式AI。雖然有34%的客戶表示他們不在評估中,但這個數(shù)字較上一季度大幅下降。
無論如何,在實際生產(chǎn)環(huán)境中,有兩件事值得注意:
1)大多數(shù)人仍處在評估階段;
2)使用案例相當(dāng)直觀,聊天機器人是最重要的應(yīng)用領(lǐng)域,其次是代碼生成、文本摘要和撰寫市場營銷文案。
我們認(rèn)為,組織必須真正理解商業(yè)案例并確定投資回報率。最大的投資回報驅(qū)動因素將是降低勞動力成本。你可以將其歸類為提高生產(chǎn)力,但最終目標(biāo)是減少對人力資源的需求。這并不一定意味著失業(yè)率會上升——它只是意味著價值的主要驅(qū)動因素將是減少員工數(shù)量。這無疑會改變就業(yè)所需的技能。
組織必須評估GenAI的風(fēng)險
一個關(guān)鍵挑戰(zhàn)是,在上層動力確實存在的情況下,部署會帶來一系列風(fēng)險問題。下面這張幻燈片來自Technalysis發(fā)布的一項最新研究,該獨立分析公司由分析師鮑勃·奧唐奈爾運營。它展示了1,000名IT決策者所關(guān)注的GenAI相關(guān)最重要的問題,包括合規(guī)性、知識產(chǎn)權(quán)泄露、法律問題(如版權(quán)侵犯)、數(shù)據(jù)和工具質(zhì)量等。
這些都是對生成AI及其使用方式謹(jǐn)慎的合理原因。
重新思考云與本地之間的平衡
對于GenAI風(fēng)險的擔(dān)憂導(dǎo)致許多組織表示他們將在本地進(jìn)行GenAI部署。
下面是ETR提供的一些數(shù)據(jù),顯示組織報告了相同比例的私有和公有基礎(chǔ)架構(gòu),即公共云或本地/邊緣部署。云的吸引力在于它擁有最好的工具,但出于Technalysis調(diào)查中提到的原因,私有基礎(chǔ)架構(gòu)預(yù)計將成為一個流行的部署選項。
但云仍然具有優(yōu)勢。目前,云中存儲了大量的數(shù)據(jù)——我們認(rèn)為40-45%的工作負(fù)載正在云上運行,也許到明年可能達(dá)到50%。正如我們在以前的研究中報道的那樣,云和本地正在趨于平衡——云仍在以更快的速度增長——但對于許多傳統(tǒng)應(yīng)用程序來說,遷移到云端的商業(yè)案例還沒有那么強大。我們相信,云端增長的很大一部分來自于現(xiàn)有云工作負(fù)載之上的新應(yīng)用程序或功能。
本地工作負(fù)載正成為注入人工智能的良機,諸如思科、IBM、戴爾技術(shù)和HPE等老牌企業(yè)正在尋找機會并積極投資。
云依然具有巨大優(yōu)勢
事實上,在與開發(fā)人員交流時,他們普遍認(rèn)為云在人工智能領(lǐng)域非常強大。以下是我們強調(diào)過的八個觀點,開發(fā)者告訴我們公共云滿足了這些需求。我們相信,在考慮云和本地GenAI解決方案之間的功能權(quán)衡時,這些觀點可以作為客戶的參考指南。
AI的創(chuàng)新速度,建立在像Amazon SageMaker這樣的先前工具之上。集成的簡易性和推動的生產(chǎn)力……使開發(fā)人員能夠迅速實現(xiàn)預(yù)期結(jié)果。我們鼓勵我們的社區(qū)訪問thecubeai.com作為一個示例,并注冊我們的私有測試版。我們的團隊使用AWS上現(xiàn)成可用的工具,包括開源LLMs、MongoDB、Milvus作為我們的向量數(shù)據(jù)庫和其他云工具,在幾周內(nèi)迅速構(gòu)建了這個平臺。
根據(jù)我們收到的查詢,模型訓(xùn)練需要更多時間,但是MVP(最小可行產(chǎn)品)開發(fā)時間僅為正常軟件產(chǎn)品開發(fā)周期的十分之一。
我們在上述第4點中強調(diào)了重要性——即模型選項的多樣性——不僅來自云供應(yīng)商,還來自于第三方供應(yīng)商。
第5點和第6點也非常關(guān)鍵——能夠隔離推理請求,使LLM供應(yīng)商無法訪問任何客戶數(shù)據(jù)。安全性提供豐富性也是關(guān)鍵因素。例如,確保數(shù)據(jù)保留在特定地區(qū)以及對數(shù)據(jù)傳輸進(jìn)行加密等功能。
云提供了從硅到AI工具鏈、最大程度的數(shù)據(jù)庫選擇、治理選擇、身份訪問、開源工具可用性以及豐富的合作伙伴生態(tài)系統(tǒng)的一流工具。
因此,盡管HPE和Dell這樣的公司已經(jīng)宣布提供LLMs作為服務(wù),但他們的能力如何,以及他們是否真正將LLMs無縫地集成到解決方案中,還并不確定。
雖然在本地進(jìn)行工作可以降低風(fēng)險并且非常合理,但現(xiàn)有企業(yè)需要做大量工作來建立全面的解決方案和生態(tài)系統(tǒng)合作伙伴堆棧。
比較云與現(xiàn)有企業(yè)之間客戶支出勢頭
與現(xiàn)有企業(yè)基礎(chǔ)設(shè)施供應(yīng)商相比,云供應(yīng)商具有更強勁的業(yè)務(wù)動力。盡管有關(guān)云優(yōu)化、重返本地和增長放緩等話題屢見不鮮,但數(shù)據(jù)仍明顯支持云供應(yīng)商。
上面是ETR數(shù)據(jù),顯示了幾位有潛力的LLM領(lǐng)導(dǎo)者的凈分?jǐn)?shù)分解。凈分?jǐn)?shù)是一種度量支出速度的指標(biāo)。它跟蹤新客戶的百分比-這就是酸橙色。深綠色表示與去年相比支出增加6%或更多。灰色表示支出持平,粉紅色表示支出減少6%或更糟,明亮紅色表示流失客戶。將紅色從綠色中減去,就可以得到右側(cè)柱形圖中顯示的凈分?jǐn)?shù)。
在凈分?jǐn)?shù)右側(cè),我們顯示了調(diào)查中的回應(yīng)數(shù)量,這是市場影響力的代理變量。因此,正如您所看到的,AWS、微軟和谷歌的凈分?jǐn)?shù)分別為51%、49%和34%,并且N值接近或超過1,000。
DELL和HPE相比,在市場影響力方面,DELL有著很強的存在感(N超過800),HPE也高達(dá)483。但從支出角度來看,云計算仍然具有明顯較高的動力。
追蹤一些關(guān)鍵數(shù)據(jù)平臺
下面我們展示了Databricks、Snowflake、IBM和Oracle等一些重要的數(shù)據(jù)平臺名稱的同樣數(shù)據(jù)。Databricks具有非??煽康?0%凈分?jǐn)?shù),已經(jīng)超過了47%的Snowflake,盡管Snowflake在市場影響力上更大。但顯然Databricks正在逐漸接近Snowflake的傳統(tǒng)領(lǐng)域。正如您所看到的,IBM和Oracle的凈分?jǐn)?shù)較低,分別為10%和-1%,但數(shù)據(jù)集中有大量數(shù)據(jù)。
GenAI何時會在利潤表中顯示出來?
我們預(yù)計對人工智能(包括GenAI)的支出將在2023年下半年開始對利潤表產(chǎn)生明顯影響。
以AWS為代表,下圖顯示了AWS自2022年第一季度以來的收入增長率。我們認(rèn)為,在第三季度,減速將趨于穩(wěn)定,根據(jù)當(dāng)前的預(yù)測,由于人工智能作為助推因素和第四季度的季節(jié)性因素,增長將在第四季度重新加速。特別是我們預(yù)計GenAI將推動更多的計算和存儲支出,并在數(shù)據(jù)平臺和相關(guān)工具方面產(chǎn)生附加支出。
這種情況存在一些風(fēng)險,包括宏觀環(huán)境和大數(shù)定律的作用,以及競爭,但我們目前的想法是我們正在云優(yōu)化的尾聲階段,并轉(zhuǎn)向新的工作負(fù)載啟用。
GenAI的功耗分布
John Furrier經(jīng)常在theCUBE上談?wù)搩缏?。我們將通過觀察對大型語言模型進(jìn)行修改后的冪律分布來進(jìn)行總結(jié)。
冪律分布是兩個數(shù)量之間的統(tǒng)計關(guān)系。簡單地說,冪律分布可以理解為80/20法則。例如,我們銷售額的80%來自我們產(chǎn)品組合中的20%。在下面的圖表中,我們對這個概念做了一些改進(jìn),認(rèn)為只有少數(shù)公司會構(gòu)建大規(guī)模的語言模型。大多數(shù)LLM將位于X軸上較長的尾部,并且非常特定于行業(yè),并且它們的規(guī)模較小。
此外,邊緣部署將會非常豐富,并且高度敏感于延遲、經(jīng)濟性和功耗消耗。
在這里,我們想要提出幾點觀點:
首先,我們認(rèn)為企業(yè)技術(shù)創(chuàng)新仍然受到消費者規(guī)模的推動。個人電腦芯片、來自搜索引擎和社交媒體的數(shù)據(jù)實力、閃存存儲以及最近的Nvidia游戲等等,所有這些都通過消費者渠道進(jìn)入了企業(yè)。
我們相信,大型云計算和消費品牌將主導(dǎo)最大模型空間和模型的持續(xù)運行。
與Web不同的是,Web上的冪律曲線就像一堵筆直向下沒有軀干的墻(橙色線沿Y軸)。我們相信LLM領(lǐng)域?qū)⑾窦t色虛線所示一樣被拉升并向右上方移動。在這個領(lǐng)域,我們相信開源和第三方工具將填補空白,以及Snowflake和Databricks等云合作伙伴。
戴爾、HPE和IBM等本地市場占主導(dǎo)地位的企業(yè)將成功,當(dāng)他們能夠利用LLM多樣性,并將其部署在他們的市場模型中...以一種與云計算一樣簡單、更受控制且對于他們特定用例而言更具成本效益的方式。重要的是,我們認(rèn)為企業(yè)人工智能將需要明確的投資回報率和經(jīng)濟價值,否則項目將無法成功。
正如我們之前所說,我們相信主要價值將來自于減少人員數(shù)量。
與此同時,我們相信邊緣計算將由基于低成本、低功耗、高性能系統(tǒng)構(gòu)建的架構(gòu)主導(dǎo) ——往往是基于Arm的設(shè)計,并且是大規(guī)模的。比如特斯拉和蘋果。我們相信邊緣計算的經(jīng)濟學(xué)最終將進(jìn)入企業(yè)并成為一股破壞性力量。
這可能需要十年左右的時間,但自個人電腦打破大型機以來,企業(yè)IT的經(jīng)濟學(xué)一直受消費者規(guī)模的推動,我們認(rèn)為這一浪潮也不例外。人工智能+數(shù)據(jù)+規(guī)模經(jīng)濟學(xué)將決定未來幾年內(nèi)行業(yè)的基本結(jié)構(gòu)。
無論您在哪個行業(yè)中,我們認(rèn)為這是一值得做出投資的。然而,應(yīng)用它需要仔細(xì)和深入的思考...
- 上一篇
無服務(wù)器計算如何加速云平臺的采用
云平臺的普及已經(jīng)加速,因為企業(yè)不必?fù)?dān)心在建立和維護(hù)專屬數(shù)據(jù)中心方面的資本投資。如今,企業(yè)可以根據(jù)需要從云提供商獲取計算和存儲容量,然后根據(jù)業(yè)務(wù)需求增加或減少。云平臺提供無與倫比的可擴展性、成本節(jié)約、可訪問性、可靠性、安全性和易用性,使其成為尋求靈活高效計算環(huán)境的企業(yè)和個人的絕佳選擇。
- 下一篇
云原生架構(gòu):構(gòu)建高可用、可伸縮的現(xiàn)代互聯(lián)網(wǎng)應(yīng)用
隨著云計算技術(shù)的飛速發(fā)展,云原生架構(gòu)已經(jīng)成為構(gòu)建現(xiàn)代互聯(lián)網(wǎng)應(yīng)用的重要范式。它不僅僅是一種技術(shù)堆棧,更是一種全新的開發(fā)思維方式,旨在提高應(yīng)用的可用性、彈性和可伸縮性。