人工智能驅(qū)動的知識圖表
知識圖:它是什么、興起和目的
知識圖(KG)是一個組織的語義網(wǎng)絡,一個主題,其中節(jié)點被稱為實體,邊是關(guān)系。它是一個框架,包含一組相關(guān)但異構(gòu)的數(shù)據(jù),如圖像、聲音、文本、視頻、數(shù)字等。—這給出了語義解釋,并讓研究人員對圖形數(shù)據(jù)運行復雜的算法來產(chǎn)生洞察力。RDF(資源描述框架)三元組存儲是一個圖形數(shù)據(jù)庫,它將數(shù)據(jù)存儲為對象或RDF三元組的網(wǎng)絡,這些對象或RDF三元組將信息分成主-謂-對象表達式。
圖論之父、數(shù)學家萊昂哈德·歐拉用圖計算了普魯士皇帝訪問柯尼希斯堡的最短距離。隨著大數(shù)據(jù)革命的到來,組織開始超越傳統(tǒng)的關(guān)系數(shù)據(jù)庫,如RDBMS。NoSQL運動讓組織可以在數(shù)據(jù)湖中存儲結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。不同類型的數(shù)據(jù)庫,如用于文檔的MongoDB和用于圖形數(shù)據(jù)庫的Neo4j,都具有圖形存儲和處理能力。然而,由于缺乏正式的數(shù)據(jù)模式和一致性來運行復雜的分析模型,他們并沒有擺脫問題。KGs填補了這一空白,并立即成為所有大型組織的核心。
KGs有三重目標。首先,KG通過搜索幫助用戶更快更容易地發(fā)現(xiàn)信息。第二,KG在開發(fā)智能推薦引擎時提供側(cè)面和上下文信息。最后,它可以通過知識圖問答(KGQA)來幫助回答查詢和進行預測。
開發(fā)知識圖表
自動知識獲取和語義映射是開發(fā)知識管理系統(tǒng)的支柱。用于知識獲取的本體工程的過程從本體學習開始,本體學習旨在自動學習相關(guān)概念并建立它們之間的關(guān)系。為了實現(xiàn)這一點,首先分析語料庫以識別搭配,然后檢索語義圖。實體豐富通過爬行語義數(shù)據(jù)和合并來自相關(guān)本體的新概念而發(fā)生。
集成來自結(jié)構(gòu)化數(shù)據(jù)源的異構(gòu)數(shù)據(jù)需要將本地模式映射到全局模式。Global-as-view (GAV)是一種基于中介的數(shù)據(jù)集成策略,它實現(xiàn)了全局模式作為源模式的視圖,將全局查詢轉(zhuǎn)換為特定于源的查詢。檢測語義類型是自動語義映射的第一步,接下來是推斷語義關(guān)系。
數(shù)據(jù)最初使用RDF建模,隨后使用RDF模式(RDFS ), Web本體語言(OWL)向模式添加語義。語義信息也可以通過關(guān)系向量以分層的方式映射。圖形神經(jīng)網(wǎng)絡(GNNs)-像圖形卷積網(wǎng)絡(GCNs)或門控圖形神經(jīng)網(wǎng)絡-用于圖形數(shù)據(jù)的對象檢測和圖像分類。
企業(yè)知識圖
當今時代的組織都在追求發(fā)現(xiàn)隱藏的信息,因此他們通過整合、標準化和協(xié)調(diào)將所有孤立的數(shù)據(jù)聯(lián)系在一起。因此,企業(yè)知識圖提供了來自圖中業(yè)務數(shù)據(jù)的知識的顯式表示。集成數(shù)據(jù)企業(yè)擁有知識網(wǎng)絡的力量,能夠發(fā)現(xiàn)關(guān)鍵的隱藏模式,從而將其數(shù)據(jù)貨幣化。
真實世界知識圖
在當今世界,我們被數(shù)據(jù)淹沒了。KGs為與多個應用程序連接的數(shù)據(jù)賦予了意義和目的,下面分享了其中的一些應用程序。
金融服務知識圖表
KGs在金融服務中有廣泛的應用,從欺詐檢測和稅務計算到財務報告和股票價格預測。通過檢查子圖的拓撲結(jié)構(gòu),可以很容易地識別由幾個集體實施欺詐的人組成的欺詐環(huán)。
股票價格可以通過聯(lián)系與各個公司的新聞相關(guān)的情緒來預測。對沖基金和銀行利用KGs提供的替代數(shù)據(jù)映射現(xiàn)有模型,從而利用KGs進行更好的預測。
醫(yī)學科學
生物醫(yī)學概念和關(guān)系以節(jié)點和邊的形式表示。通過應用KGs,醫(yī)學成像分析可用于疾病分類、疾病藥物治療和分割、報告生成和圖像檢索。來自統(tǒng)一醫(yī)學語言系統(tǒng)(UMLS)的文本醫(yī)學知識(TMK)被分析以生成關(guān)鍵醫(yī)學見解和個性化患者報告。
實時供應鏈管理
供應鏈組織使用KGs來優(yōu)化庫存、補貨、網(wǎng)絡和分銷管理以及運輸管理。連接的供應鏈KG從生產(chǎn)的制造KG中獲取輸入,包括人員,加上零售KG,零售KG包括實時和預測需求,以便更好地預測和管理。
結(jié)論
知識圖具有創(chuàng)建虛擬世界的能力,在虛擬世界中,所有實體都通過一種已證實的關(guān)系連接在一起。復雜的機器學習算法被應用來修剪那些關(guān)系概率很小的連接。因此,通過KG可以建立世界上所有對象之間的關(guān)系。
利用所有過去和現(xiàn)在的數(shù)據(jù),KG通過識別模式產(chǎn)生深刻的見解。一公斤也幫助我們預測未來的所有相關(guān)數(shù)據(jù)導致一種現(xiàn)象。隨著以下道路的分享,未來的KGs可能會更加強大:
- 事物圖表(GoT) –GoT是一個創(chuàng)新項目,旨在融合物聯(lián)網(wǎng)(IoT)的大容量流數(shù)據(jù)和過去的靜態(tài)數(shù)據(jù)。
- 公斤的量子人工智能 –Quantum AI可以利用量子計算的能力在KG上運行GNNs,并可以獲得超出傳統(tǒng)計算能力的結(jié)果。
如果這些利益被用于社會福利,一個所有信息都通過一公斤連接起來的世界將會變得非常美好。KG之上的AI,如果使用意圖正確,會讓世界變得更美好。