人工智能不會以數(shù)據(jù)集結(jié)束
我記得我在AI領(lǐng)域的本科教授說:“AI是他們所謂的機器智能,他們還沒有完全理解。一旦他們理解了它,它就不再被認為是人工智能。一旦機器人技術(shù)被很好地理解,它就不再是人工智能,而是成為了它自己的分支。一旦計算機視覺被理解,它就變得獨立了。語音識別和自然語言處理也遵循了這條路線。”也許,唯一一個被充分理解但對人工智能如此重要以至于分離會使人工智能變得毫無意義的領(lǐng)域是機器學(xué)習(xí),這是一門使用復(fù)雜的數(shù)學(xué)密集型算法來插入潛在函數(shù)的科學(xué)。正是由于這種特殊的地位,我們有時會得到諸如“人工智能和機器學(xué)習(xí)”之類的口號,這有點像在說“數(shù)學(xué)和微積分”。
機器學(xué)習(xí)(包括更著名的分支“深度學(xué)習(xí)”)當然是至關(guān)重要的。ML算法在許多AI領(lǐng)域都很常見,它們是非常深奧的關(guān)鍵,它可以幫助機器從一些晦澀的輸入中猜測出期望的結(jié)果。將數(shù)據(jù)集加載到模型中,瞧——你得到了預(yù)測。ML實現(xiàn)了這一點。媒體得到消息。如果你閱讀了這些天最流行的文章,你可能會相信人工智能會神奇地解決所有問題。總體配方對于錯誤來說是平庸的-收集數(shù)據(jù)集,找到可以插入問題復(fù)雜性的ML算法,訓(xùn)練模型并收集現(xiàn)金。簡單的。
然而,正如任何真正的人工智能從業(yè)者都知道的那樣,機器學(xué)習(xí)雖然至關(guān)重要,但并不是問題的核心。GoogleML研究人員的一篇開創(chuàng)性NIPS論文深入解釋了機器學(xué)習(xí)只是AI應(yīng)用程序的一小部分。大部分工作圍繞著優(yōu)化管道、收集干凈的數(shù)據(jù)和提取適合ML模型并在動態(tài)環(huán)境中可維護的特征。這在自然語言理解中尤其明顯,為了提取分類器模型可口的特征,需要解決拼寫錯誤、詞干、停用詞、消除歧義實體引用,可能,查看上下文,了解人們經(jīng)常使用虛構(gòu)單詞,準備好慢慢變化的詞匯和主題分布,以及無數(shù)其他事情。
有人可能會問,為什么不完全跳過這一點,將任務(wù)加載到一個強大的深度學(xué)習(xí)盒子中呢?當然,我們可以用數(shù)據(jù)建模的復(fù)雜性來換取在訓(xùn)練階段花費更多的時間嗎?好吧,祝你好運。你試過用年輪預(yù)測天氣嗎?它們是相關(guān)的……您的機器應(yīng)該能夠找到從一個到另一個的路徑。問題是,到那時你可能已經(jīng)在地下安靜地休息了很久。一些用于預(yù)測天氣的最強大的超級計算機仍然做出不準確的預(yù)測。有一個原因——計算的指數(shù)復(fù)雜性不是開玩笑。
這就是領(lǐng)域?qū)I(yè)知識變得無價的地方。簡而言之,人類專家可以通過為機器提供快捷方式來減少許多不必要的計算。這是通過使用人類專家多年來在特定領(lǐng)域積累的知識對推理路徑進行建模來完成的。繼續(xù)使用NLU,一個很好的例子是使用來自語言學(xué)的信息來豐富數(shù)據(jù),例如詞性、句子結(jié)構(gòu)(即解析樹)、正字法等。要了解其好處,請考慮如何有效地管理復(fù)雜的項目。您要做的第一件事是將其分解并建立中間里程碑。這些范圍更小,更容易定義,因此更容易達到。然后將實現(xiàn)更大的整體簡化為達到每個中間里程碑,這更容易定義和跟蹤。
但建模不僅僅是走捷徑。訓(xùn)練數(shù)據(jù)集的支持者忽略了過多的領(lǐng)域,甚至很難定義如何編譯數(shù)據(jù)集進行訓(xùn)練。這意味著人們將很難向注釋者(用預(yù)期結(jié)果標記數(shù)據(jù)集的人)解釋如何為每個數(shù)據(jù)樣本得出預(yù)期結(jié)果的邏輯。有時,標簽的模糊性使事情變得復(fù)雜。其他時候,是分析輸入數(shù)據(jù)的復(fù)雜性——可能完全不可能向人類提供所需的感官數(shù)據(jù)。在物理世界中,某些測量值可能對注釋器很危險(例如,如果您的輸入是氣體)。這些情況中的每一種都會立即使收集數(shù)據(jù)的整個過程從一開始就變得不可行。
可能值得重新檢查所有從人工智能“分支”的領(lǐng)域。其中一個共同的主題是領(lǐng)域建模和知識的數(shù)量驚人。例如,機器人技術(shù)依賴于運動物理學(xué)、力學(xué)、材料、電氣工程、光學(xué)和其他更基礎(chǔ)的科學(xué)。雖然最終結(jié)果可能是將圖像輸入CV單元,但大部分“魔法”實際上發(fā)生在此之前。換句話說,制造“神奇”人工智能應(yīng)用程序的根本不是ML,而是描述系統(tǒng)進行預(yù)測的領(lǐng)域的公理、定理、測量、調(diào)整等的混合物。ML只是錦上添花。這些領(lǐng)域的應(yīng)用程序不依賴機器將輸入與輸出相關(guān)聯(lián),而是將領(lǐng)域知識放在首位,自下而上地構(gòu)建他們的技術(shù)——從基本規(guī)則到復(fù)雜系統(tǒng),可能會在一些步驟中與ML連接起來。它們的整體構(gòu)成始終由領(lǐng)域邏輯驅(qū)動。
這樣做的好處是很多的。首先,您不再需要嚴重依賴手動數(shù)據(jù)收集,正如我們所討論的,手動數(shù)據(jù)收集充滿了限制和錯誤。這樣可以更全面地覆蓋您的域。想一想你想要什么,一個2個數(shù)字相乘的規(guī)則,還是一個列出不同對可達數(shù)字乘積的無限表?其次,您能夠向最終用戶解釋推論。
與其強調(diào)你的反向傳播是如何在第7個隱藏層上進行的,你可以解釋它是一個具有真實英文名稱的特定領(lǐng)域特征,它對結(jié)果的影響最大。第三,它允許更清潔的產(chǎn)品組裝以及用更優(yōu)化的實現(xiàn)替換組件的能力。嘗試使用ML管道來做到這一點?。ㄟ@是值得再次閱讀上述NIPS論文的地方)
那么,你可能會問?到目前為止,您可能同意域建模對于有效實施至關(guān)重要。您決定聘請領(lǐng)域?qū)<也⒗^續(xù)前進。還有更多嗎?是的!因為領(lǐng)域建模對于AI應(yīng)用如此重要,它也可以作為尋找新的AI未開發(fā)應(yīng)用的指南針!換句話說,為了尋找新的機會,尋找一個數(shù)據(jù)難以收集的領(lǐng)域,而一般的領(lǐng)域環(huán)境很好理解,只是缺乏自動化。正是在那些空間中,人們可以通過一個簡單的ML橋來縮小兩個領(lǐng)域知識集群之間的小差距,并突然獲得更令人印象深刻的結(jié)果。而且,與“我們將所有事物與所有人群相關(guān)聯(lián)”不同,您將擁有完整的域覆蓋范圍、更好的描述能力,以及最終,
- 上一篇
將智能技術(shù)融入設(shè)計可以為城市增加更多價值
智慧城市不僅可以通過高效運營節(jié)省的資金來增加價值,還可以通過添加出色的設(shè)計為市民和當?shù)仄髽I(yè)帶來額外的好處。讓我們改變設(shè)計——建造一座城市。建設(shè)真正&ldquo
- 下一篇
人工智能是無偏見風(fēng)險投資的關(guān)鍵
獲得風(fēng)險投資資金是一個棘手的旅行領(lǐng)域。對于創(chuàng)始人來說,積累繼續(xù)擴大規(guī)模所需的資金已經(jīng)足夠困難了,但對于來自代表性不足的人口統(tǒng)計數(shù)據(jù)的企業(yè)家來說,這更加困難。巴布森學(xué)院
相關(guān)資訊
- 數(shù)字化轉(zhuǎn)型中的企業(yè)架構(gòu)管理
- 5種簡化您的業(yè)務(wù)數(shù)據(jù)以實現(xiàn)最高
- 數(shù)字孿生如何實現(xiàn)成功的工程和轉(zhuǎn)
- 數(shù)據(jù)可以決定學(xué)習(xí)是如何發(fā)生的嗎
- 利用大數(shù)據(jù)分析徹底改變旅游業(yè)
- 大中型企業(yè)可以從超級計算革命中
- 人工智能如何平衡外部環(huán)境與內(nèi)部
- 政府大數(shù)據(jù)困局:數(shù)據(jù)匯聚多,應(yīng)用場
- 人工智能能否通過創(chuàng)新彌補其對氣
- 2021年蜂窩物聯(lián)網(wǎng)網(wǎng)關(guān)市場規(guī)模達