讓AI像人那樣思考,離我們還有多遠(yuǎn)?
認(rèn)知架構(gòu)(Cognitive Architecture)是通用人工智能研究的一個(gè)子集,始于 1950 年代,其最終目標(biāo)是對人類思維進(jìn)行建模,這將使我們更接近構(gòu)建人類水平的人工智能。此外,認(rèn)知架構(gòu)試圖提供證據(jù)來表明特定機(jī)制能夠成功地產(chǎn)生智能行為,從而有助于認(rèn)知科學(xué)的研究。本文概述了過去 40 年對認(rèn)知架構(gòu)的研究,盡管現(xiàn)有架構(gòu)的數(shù)量接近幾百個(gè),但大多數(shù)現(xiàn)有的綜述都不能反映這種增長,并專注于少數(shù)成熟的架構(gòu)。
在實(shí)踐中,“認(rèn)知架構(gòu)”一詞不那么嚴(yán)格,大多數(shù)學(xué)術(shù)論文中將認(rèn)知架構(gòu)定義為智能的藍(lán)圖,或者更具體地說,是關(guān)于實(shí)現(xiàn)一系列智能行為的心理表征和計(jì)算程序的支撐。 從歷史上看,心理學(xué)和計(jì)算機(jī)科學(xué)是認(rèn)知架構(gòu)的靈感來源,即人類認(rèn)知過程的理論模型和相應(yīng)的軟件工件,允許演示和評估潛在的心理理論。認(rèn)知架構(gòu)通常具有與人類認(rèn)知能力相對應(yīng)的功能模塊,并解決行動選擇、適應(yīng)性行為、高效數(shù)據(jù)處理和存儲等問題。
在本文中,作者選擇了 84 個(gè)架構(gòu),并借鑒了一組不同的學(xué)科來進(jìn)行分類,涵蓋了從心理分析到神經(jīng)科學(xué)的領(lǐng)域。圖中的認(rèn)知架構(gòu)按綜述中的引用總數(shù)和每個(gè)認(rèn)知架構(gòu)的在線來源進(jìn)行排序,本文涉及的認(rèn)知架構(gòu)的標(biāo)題被標(biāo)注為紅色。雖然主要架構(gòu)的理論和實(shí)際貢獻(xiàn)是不可否認(rèn)的,但它們只代表了該領(lǐng)域的研究的一部分。因此,在這篇綜述中,目標(biāo)是展示過去 40 年開發(fā)的廣泛、包容性、中立的概述,目的是通過展示已嘗試的想法的多樣性來啟發(fā)未來的認(rèn)知架構(gòu)研究。
下圖中則呈現(xiàn)了 84 種認(rèn)知架構(gòu)的時(shí)間線。每行對應(yīng)一個(gè)架構(gòu)。架構(gòu)按起始日期排序,以便最早的架構(gòu)繪制在圖中的底部。顏色對應(yīng)于不同類型的架構(gòu):符號(綠色)、神經(jīng)(紅色,在生物學(xué)上受到啟發(fā))和符號-神經(jīng)混合(藍(lán)色)。
根據(jù)這些數(shù)據(jù),自 1980 年代中期到 1990 年代初以來,基于符號的架構(gòu)居多,但是在 2000 年代后,大多數(shù)新開發(fā)的架構(gòu)都是混合架構(gòu)和神經(jīng)架構(gòu),在時(shí)間線中分布相當(dāng)均勻。
模型分類(Taxonomies of cognitive architectures)
在沒有明確的認(rèn)知定義和一般理論的情況下,每個(gè)架構(gòu)都基于一組不同的前提和假設(shè),使得比較和評估變得困難。Newell 的標(biāo)準(zhǔn)(The Newell Test for a theory of cognition)包括靈活的行為、實(shí)時(shí)操作、合理性、大型知識庫、學(xué)習(xí)、開發(fā)、語言能力、自我意識和大腦實(shí)現(xiàn)。
Sun 的定義(Desiderata for cognitive architectures)更廣泛,包括生態(tài)、認(rèn)知和生物進(jìn)化現(xiàn)實(shí)主義、適應(yīng)、模塊化、日常性和協(xié)同互動。根據(jù) Sun 提出的觀點(diǎn),基于心理的認(rèn)知架構(gòu)應(yīng)該通過不僅對人類行為進(jìn)行建模以及潛在的認(rèn)知過程來促進(jìn)對人類思維的研究。與面向軟件工程的“認(rèn)知”架構(gòu)不同,此類模型是一般人類認(rèn)知機(jī)制的顯式表征,這對于理解大腦至關(guān)重要。
模型大概可以分成三類,涌現(xiàn)架構(gòu)/神經(jīng)架構(gòu)(Emergent,受到生物啟發(fā)的架構(gòu),主要是神經(jīng)流派,因此下文中統(tǒng)一稱為神經(jīng)架構(gòu)),混合架構(gòu)(Hybrid,包含了符號和神經(jīng)流派),符號架構(gòu)(Symbolic)。其中,混合架構(gòu)匯總包含子字符號處理的分類,表示其更偏向于符號流派,但是至少用到了一些神經(jīng)模塊。
感知(Perception)
無論其設(shè)計(jì)和目的如何,智能系統(tǒng)都不能孤立地存在,并且需要輸入來產(chǎn)生任何行為。雖然歷史上主要的認(rèn)知架構(gòu)側(cè)重于更高層次的推理,但很明顯,感知和動作在人類認(rèn)知中起著重要作用。感知可以定義為將原始輸入轉(zhuǎn)換為系統(tǒng)內(nèi)部表征以執(zhí)行認(rèn)知任務(wù)的過程。根據(jù)傳入數(shù)據(jù)的來源和屬性,區(qū)分多種感知模態(tài)。例如,五個(gè)最常見的是視覺、聽覺、嗅覺、觸覺和味覺。
從圖 4 的可視化結(jié)果中可以得出幾個(gè)觀察結(jié)果,其中,字母分別對應(yīng)——V:視覺(vision),D:符號輸入(symbolic input),P:本體感覺(proprioception), O:其他感覺(other sensors),A:聽覺(audition),T:觸覺(touch),S:嗅覺(smell),M:多模態(tài)感覺(multi-modal)。逆時(shí)針,越靠后涉及的模態(tài)越多。
可以看出,視覺是被最廣泛涉及的,但是,超過一半的架構(gòu)使用模擬進(jìn)行視覺輸入而不是物理相機(jī)。某些感覺仍然相對而言沒有被充分探索,例如對氣味的感覺僅以三種架構(gòu)(GLAIR 、DAC 和 PRS )出現(xiàn)。
總體而言,設(shè)計(jì)的符號架構(gòu)的感知能力有限,傾向于使用直接數(shù)據(jù)輸入作為唯一的信息來源。另一方面,混合架構(gòu)和神經(jīng)架構(gòu)(主要位于圖表的右半部分)實(shí)現(xiàn)了更廣泛的感官模式,包括模擬傳感器和物理傳感器。然而,無論其來源如何,傳入的感官數(shù)據(jù)通常無法以原始形式使用(除了符號輸入),并且需要進(jìn)一步處理。
視覺的輸入,主要包含了 2 種,第一種是物理世界輸入,第二種是模擬視覺輸入。物理世界輸入指的是由真實(shí)相機(jī)拍攝的圖片,或者已有的圖片,以像素為主。模擬視覺系統(tǒng)通常省略早期和中間視覺,并以適合視覺處理后期階段的形式接收輸入(例如形狀和顏色的符號描述、對象標(biāo)簽、坐標(biāo)等)。
注意(Attention)
注意在人類認(rèn)知中起著重要作用,因?yàn)樗閷?dǎo)了相關(guān)信息的選擇,并從傳入的感官數(shù)據(jù)中過濾掉不相關(guān)的信息。有充分的證據(jù)表明,注意是一組影響知覺和認(rèn)知過程的機(jī)制,目前,視覺注意仍然是研究最多的注意形式,因?yàn)槠渌泄倌J經(jīng)]有全面的框架。
注意的元素分為三類信息縮減機(jī)制:選擇(selection)、限制(restriction)、和抑制(suppression):
選擇機(jī)制包括注視和視點(diǎn)選擇、世界模型(選擇要關(guān)注的對象/事件)和感興趣的時(shí)間/區(qū)域/特征/對象/事件;
限制機(jī)制用于內(nèi)生動機(jī)(領(lǐng)域知識)、外生線索(外部刺激)、外生任務(wù)(嚴(yán)格關(guān)注與任務(wù)相關(guān)的對象)和視野(有限的視野)來修剪搜索空間;
抑制機(jī)制包括特征/空間環(huán)繞抑制(在參與時(shí)暫時(shí)抑制物體周圍的特征)、任務(wù)無關(guān)的刺激抑制、負(fù)啟動和位置/對象抑制返回(一種偏向于將注意力返回到先前參與的位置或刺激)。
根據(jù)上述描述,對模型中使用注意機(jī)制涉及到的方向進(jìn)行匯總(抑制、選擇和限制機(jī)制分別用藍(lán)色、黃色和綠色陰影表示):
在認(rèn)知和心理文獻(xiàn)中,注意也被用作分配有限資源的廣泛術(shù)語。例如,在全局工作空間理論(GWT)中,注意機(jī)制對于感知、認(rèn)知和動作至關(guān)重要。根據(jù) GWT,神經(jīng)系統(tǒng)被組織為并行運(yùn)行的多個(gè)專家模塊。受 GWT 影響的其他架構(gòu)包括 ARCADIA 和 CRA-CRANIUM,以及 LIDA。在 CGNET 中實(shí)現(xiàn)了類似的想法,DUAL 和Copycat/Metacat,其中多個(gè)模塊也競爭注意力。
動作選擇(Action selection)
動作選擇主要是確定“接下來做什么”,其可以分為涉及決策的部分和與運(yùn)動控制相關(guān)的部分。然而,這種區(qū)別并不總是在文獻(xiàn)中明確做出的,其中動作選擇可能指的是目標(biāo)、任務(wù)或命令。例如,在 MIDAS 架構(gòu)動作選擇中,動作選擇既涉及下一個(gè)目標(biāo),又涉及實(shí)現(xiàn)它的動作 。類似地,在 MIDCA 中,如果存在,則通常從計(jì)劃的序列中選擇下一個(gè)動作。
除此之外,不同的機(jī)制還負(fù)責(zé)采用基于動態(tài)確定優(yōu)先級的新目標(biāo),在 COGNET 和 DIARC 中,任務(wù)/目標(biāo)的選擇會觸發(fā)相關(guān)程序知識的執(zhí)行。在 DSO 中,選擇器模塊在可用的動作或決策之間進(jìn)行選擇,以達(dá)到當(dāng)前的目標(biāo)和子目標(biāo)。
在本文中,作者區(qū)分了兩種主要的動作選擇方法:規(guī)劃(planning)和動態(tài)動作選擇(dynamic action selection)。
規(guī)劃是指傳統(tǒng)的 AI 算法,用于確定達(dá)到某個(gè)目標(biāo)的一系列步驟,或者提前解決問題,目標(biāo)遞歸分解為子目標(biāo)的任務(wù)分解是一種非常常見的規(guī)劃形式(例如 Soar, Teton, PRODIGY)。
與規(guī)劃對立的是反應(yīng)性動作(Reactive Action),其會立即執(zhí)行,暫停任何正在進(jìn)行的活動并繞過推理,類似于人類的反射動作作為刺激的自動響應(yīng)。然而,純反應(yīng)性系統(tǒng)很少見,反應(yīng)動作僅在某些條件下使用。例如,它們被用來保護(hù)機(jī)器人免受碰撞(ATLANTIS, 3T)或自動響應(yīng)意外刺激。
在動態(tài)動作選擇中,根據(jù)當(dāng)時(shí)可用的知識,在備選方案中選擇一個(gè)最佳動作,包括有限狀態(tài)機(jī)(CSM),它們經(jīng)常用于表征運(yùn)動動作序列(ATLANITIS, CARAACS),甚至對系統(tǒng)的整個(gè)行為進(jìn)行編碼(ARDIS, STAR)。概率動作選擇也很常見(iCub, CSE, CogPrime, Sigma, Darw.Neurodynamic, ERE, Novelemente)。
動機(jī)系統(tǒng)(Motivation System)
動機(jī)本質(zhì)上是對動作選擇進(jìn)行干預(yù)和調(diào)整,因此,作者將動機(jī)系統(tǒng)放入到了動作選擇部分匯總,在這里,我們將動機(jī)系統(tǒng)獨(dú)立成為一節(jié)。在選擇下一個(gè)動作時(shí)可以考慮幾個(gè)標(biāo)準(zhǔn):相關(guān)性 relevance、效用 utility 和情感emotion(包括動機(jī)、情感狀態(tài)、情緒、心境、欲望 等)。
1. 相關(guān)性
反映了動作與當(dāng)前情況的匹配程度。這主要適用于具有符號推理的系統(tǒng),并在應(yīng)用規(guī)則之前檢查規(guī)則的前置和/或后置條件(MAX、Disciple、EPIC、GLAI、PRODIGY、MIDAS、R-CAST、Disciple、Companions、Ymir、Pogamut、Soar、ACT-R)。
2. 動作的效用
是其對當(dāng)前目標(biāo)的預(yù)期貢獻(xiàn)的度量(CERACRANIUM 、CHARISMA 、DIARC、MACSi 、MAMID 、NARS 、Novamente)。一些架構(gòu)還對候選動作執(zhí)行“干燥運(yùn)行”(dry run),并觀察它們確定其效用的影響(MLECOG 、RoboCog )。
效用還可以考慮過去動作的性能,并通過強(qiáng)化學(xué)習(xí)(ASMO、BECCA、CLARION、PRODIGY、CSE、CoJACK、DiPRA、Disciple、DSO、FORR、ICARUS、ISAC、MDB、MicroPsi、Soar)來提高未來的行為。其他機(jī)器學(xué)習(xí)技術(shù)也用于將目標(biāo)與過去成功行為聯(lián)系起來(MIDCA 、SASE 、CogPrime)。
內(nèi)部因素不直接確定下一個(gè)行為,而是 bias 這個(gè)選擇,為簡單起見,這里考慮與人類情緒、驅(qū)動和人格特征相對應(yīng)的短期、長期和終身因素。鑒于這些因素對人類決策和其他認(rèn)知能力的影響,在認(rèn)知架構(gòu)中對情緒和情感進(jìn)行建模很重要,尤其是在人機(jī)交互、社交機(jī)器人和虛擬代理領(lǐng)域。毫不奇怪,這是迄今為止花費(fèi)的大部分努力的地方。
3. 情緒
認(rèn)知架構(gòu)中的人工情緒通常被建模為影響認(rèn)知能力的瞬態(tài)狀態(tài)(與憤怒、恐懼、喜悅等相關(guān))。例如,在 CoJACK 中, 道德和恐懼情緒可以修改計(jì)劃選擇。因此,當(dāng)?shù)赖螺^高時(shí),面臨威脅的計(jì)劃具有更高的效用,但在恐懼較高時(shí)的效用較低。
其他示例包括影響背包策略的快樂/悲傷情緒(CHART)、焦慮狀態(tài)中的類比推理(DUAL)、喚醒對記憶的影響(ACT-R)、根據(jù)目標(biāo)滿意度(DIARC)和 HCI 場景中的情緒學(xué)習(xí)(CELTS)的正面和負(fù)面影響。
4. 驅(qū)動(廣義動機(jī))
驅(qū)動是內(nèi)部動機(jī)的另一個(gè)來源。從廣義上講,它們代表了食物和安全等基本生理需求,但也可能包括高級或社交驅(qū)動。通常,任何驅(qū)動的強(qiáng)度都會隨著驅(qū)動的滿足而減少。由于 agent 總是朝著其目標(biāo)工作,一些驅(qū)動可能會同時(shí)影響其行為。
例如,在 ASMO 中,有三個(gè)相對簡單的驅(qū)動:喜歡紅色、想要表揚(yáng)和幸福,通過修改權(quán)重來偏置動作選擇相應(yīng)的模塊。在 CHARISMA 保存驅(qū)動(避免傷害和饑餓)中,結(jié)合好奇心和愿望自我改進(jìn)來指導(dǎo)行為生成。在 MACSi 中,好奇心推動探索代理學(xué)習(xí)最快區(qū)域。同樣,在 CERA-CRANIUM 中,好奇心、恐懼和憤怒會影響移動機(jī)器人對環(huán)境的探索。
社交機(jī)器人 Kismet 設(shè)置了驅(qū)動,結(jié)合外部事件有助于機(jī)器人的情感狀態(tài)(或“情緒”),并通過面部手勢、立場或聲音語氣的變化將其表達(dá)為憤怒、厭惡、恐懼、喜悅、悲傷和驚訝。盡管其動機(jī)機(jī)制是硬編碼的,但 Kismet 展示了所有認(rèn)知架構(gòu)的最廣泛情感行為庫之一。
5. 人格特征
與具有瞬態(tài)性質(zhì)的情緒不同,人格特征是獨(dú)特的長期行為模式,在內(nèi)部動機(jī)、情緒、決策等方面表現(xiàn)為一致的偏好。大多數(shù)已識別的人格特征可以簡化為一小組必要的維度/因素,足以廣泛描述人類人格(如五因素模型 FFM 和 Mayers-Briggs 模型)。同樣,認(rèn)知架構(gòu)中的個(gè)性通常由幾個(gè)因素/維度表征,不一定是基于已知模型。反過來,這些特征與系統(tǒng)可能與經(jīng)歷的情緒和/或驅(qū)動有關(guān)。
在最簡單的情況下,單個(gè)參數(shù)足以在系統(tǒng)的行為中產(chǎn)生系統(tǒng)偏差。NARS 和 CogPrime 都使用“個(gè)性參數(shù)”來定義評估邏輯語句的真實(shí)性或分別規(guī)劃下一個(gè)動作需要多少證據(jù)(LeCun 本質(zhì)上也用的這種方法)。參數(shù)值越大,系統(tǒng)似乎越“保守”。
類似地,在 AIS 特征(例如 厭惡、冷靜、害羞、自信、懶惰)中,被分配了一個(gè)整數(shù)值,它定義了它們所表現(xiàn)出的程度。規(guī)則定義了在給定個(gè)性的情況下更有可能的行為。在 CLARION 中,人格類型決定了許多預(yù)定義驅(qū)動的基線強(qiáng)度和初始缺陷(即傾向)。
CLARION 提供了一個(gè)認(rèn)知上合理的框架,該框架能夠解決情緒、驅(qū)動和個(gè)性特征,并將它們與包括決策在內(nèi)的其他認(rèn)知過程相關(guān)聯(lián)。情緒的三個(gè)方面被建模:反應(yīng)情緒(或情緒的無意識經(jīng)驗(yàn))、協(xié)商評估(可能有意識)和應(yīng)對/行動(遵循評估)。
因此,情緒作為顯式和隱式過程之間的交互出現(xiàn),涉及(并影響)感知、動作和認(rèn)知。MAMID 是由外部事件、內(nèi)部解釋、目標(biāo)和個(gè)性特征產(chǎn)生的情緒產(chǎn)生和影響的模型。在內(nèi)部,信念網(wǎng)絡(luò)將任務(wù)和個(gè)人特定的標(biāo)準(zhǔn)聯(lián)系起來,例如目標(biāo)失敗是否會導(dǎo)致特定代理中的焦慮。
框架涉及到的動作選擇方法(Planning,Reactive,WTA,Probabilistic,Predefined),一些指標(biāo)(relevance,utility)和動機(jī)系統(tǒng)(internal factor,包括 emotion,drives,personality)。
記憶(Memory)
記憶是任何系統(tǒng)級認(rèn)知模型的重要組成部分,無論模型是否用于研究人類思維或解決工程問題。本文提到的幾乎所有架構(gòu)都具有存儲計(jì)算中間結(jié)果的記憶系統(tǒng),從而能夠?qū)W習(xí)和適應(yīng)不斷變化的環(huán)境。然而,盡管它們的功能相似,但記憶系統(tǒng)的特定實(shí)現(xiàn)差異很大,并且取決于研究目標(biāo)和概念限制,例如生物學(xué)合理性和工程因素(例如編程語言、軟件架構(gòu)、框架使用等)。
在認(rèn)知架構(gòu)文獻(xiàn)中,記憶根據(jù)其持續(xù)時(shí)間(短期和長期)和類型(程序性、陳述性、語義等)來描述,盡管它不一定實(shí)現(xiàn)為單獨(dú)的知識存儲。
長期知識通常被稱為事實(shí)和解決問題規(guī)則的知識庫,這些規(guī)則對應(yīng)于語義和程序的長期記憶(例如 Disciple、maci、PRS、ARDIS、ATLANTIS、IMPRINT)。一些架構(gòu)還保存了以前實(shí)現(xiàn)的任務(wù)并解決的問題,模仿情景記憶(REM,PRODIGY)。短期存儲通常由當(dāng)前世界模型或目標(biāo)堆棧的內(nèi)容表征。
下圖顯示了架構(gòu)實(shí)現(xiàn)的各種類型的記憶的可視化。在這里,遵循區(qū)分長期和短期記憶的慣例,長期記憶進(jìn)一步細(xì)分為語義、程序性和情節(jié)類型,它們存儲事實(shí)知識、在特定條件下應(yīng)該采取什么行動的信息以及系統(tǒng)個(gè)人經(jīng)驗(yàn)中的情節(jié)。
短期存儲分為感覺記憶和工作記憶。感官或感知記憶是一個(gè)非常短期的緩沖區(qū),它存儲了幾個(gè)最近的感知。工作記憶是感知臨時(shí)存儲,它也包含與當(dāng)前任務(wù)相關(guān)的其他項(xiàng)目,并且經(jīng)常與當(dāng)前的注意力焦點(diǎn)相關(guān)聯(lián)。
1. 感知記憶
感知記憶的目的是緩存?zhèn)魅氲母泄贁?shù)據(jù)并在將其轉(zhuǎn)移到其他記憶結(jié)構(gòu)之前對其進(jìn)行預(yù)處理。其有助于解決連續(xù)性和維護(hù)問題,即識別對象的單獨(dú)實(shí)例相同,并在無人參與時(shí)保留對象的印象(ARCADIA)。類似地,回聲記憶允許聲學(xué)刺激長時(shí)間持續(xù)存在以檢測綁定和特征提取,例如音高提取和分組(MusiCog)。
感知記憶中項(xiàng)目的衰減率被認(rèn)為是視覺數(shù)據(jù)的數(shù)十毫秒(EPC, LIDA),并且對于音頻數(shù)據(jù)更長(MusiCog),盡管并不總是指定時(shí)間限制。實(shí)現(xiàn)這種記憶類型的其他架構(gòu)包括 Soar、Sigma、ACT-R 、CHARSMA , CLARION 、ICARUS 和 Pogamut 。
2. 工作記憶
工作記憶可以定義為臨時(shí)存儲與當(dāng)前任務(wù)相關(guān)的信息的機(jī)制。這對于注意力、推理和學(xué)習(xí)等認(rèn)知能力至關(guān)重要,本質(zhì)上,所有認(rèn)知框架都以某種形式間接地實(shí)現(xiàn)了工作記憶。工作記憶的特定實(shí)現(xiàn)主要在于存儲哪些信息、如何表征、取用和維持。
盡管工作記憶對人類認(rèn)知很重要,但相對較少的出版物提供了有關(guān)其內(nèi)部組織和與其他模塊聯(lián)系的充分細(xì)節(jié)。許多工作記憶或等效結(jié)構(gòu)的架構(gòu)中,工作記憶主要作為當(dāng)前世界模型的緩存、系統(tǒng)的狀態(tài)和/或當(dāng)前目標(biāo)。盡管工作記憶能力沒有明顯限制,但新的目標(biāo)或新的感官數(shù)據(jù)通常會覆蓋現(xiàn)有內(nèi)容。
關(guān)于工作記憶的實(shí)現(xiàn),有以下幾種:
工作記憶保存著最相關(guān)的知識,這些知識是由上層“歸納偏置”決定的長期記憶檢索出來的。這種“歸納偏置”被稱為激活,包括每次訪問時(shí)的基本級激活(可能會減少或增加),也可能包括來自鄰近元素的擴(kuò)散激活。元素的激活越高,它就越有可能進(jìn)入工作記憶,并直接影響系統(tǒng)的行為,這中情況比較適用于基于圖的知識結(jié)構(gòu)(Soar, CAPS , ADAPT, DUAL , Sigma , CELTS, NARS ,Novamente, MAMID)。
激活也可以用于神經(jīng)網(wǎng)絡(luò)表征(Shruti , CogPrime,Recommend,SASE,Darwin. Nerualdynamic)。激活機(jī)制有助于模擬工作記憶的許多屬性,例如有限容量、時(shí)間衰減、隨著環(huán)境變化而快速更新、與其他記憶組件的連接以及決策。
黑板架構(gòu),它將記憶表征為目標(biāo)、問題和部分結(jié)果的共享存儲庫,可以由并行運(yùn)行的模塊訪問和修改(AIS、CERA-CRANIUM、CoSy、FORR、Ymir、LIDA、ARCADIA、Copycat/Metacat、CHARISMA、PolyScheme、PRS)。
工作記憶是一種相對較小的臨時(shí)存儲器,從生物現(xiàn)實(shí)主義的角度來看,它的容量應(yīng)該是有限的。然而,對于應(yīng)該如何做到這一點(diǎn),人們并沒有達(dá)成共識。例如,在 GLAIR 中,當(dāng)代理切換到一個(gè)新問題時(shí),工作記憶的內(nèi)容將被丟棄。
一種更常見的方法是,根據(jù)條目在變化上下文中的最近性或相關(guān)性,逐漸從記憶中刪除它們。CELTS 架構(gòu)通過為感知分配與感知情境的情緒效用成正比的激活級別來實(shí)現(xiàn)這一原則,這個(gè)激活級別隨著時(shí)間的推移而變化,一旦它低于設(shè)置的閾值,感知就會被丟棄。Novamente 認(rèn)知引擎也有類似的機(jī)制,只要原子與其他記憶元素建立了聯(lián)系,并增加了它們的效用,它們就會留在記憶中。
目前還不清楚在這些條件下,工作記憶的大小是否可以在沒有任何額外限制的情況下大幅增長。此外,記憶中的組塊數(shù)量決定了硬限制,例如,ARCADIA 中有 3~6 個(gè)對象,CHREST 中有 4 個(gè)組塊,MDB 中最多有 20 個(gè)項(xiàng)。然后,當(dāng)新信息到達(dá)時(shí),舊的或最不相關(guān)的項(xiàng)目將被刪除,以避免溢出。
3. 長時(shí)記憶
長時(shí)記憶(LTM)在很長一段時(shí)間內(nèi)保存大量的信息。通常,它分為包含內(nèi)隱知識(如運(yùn)動技能和日常習(xí)慣)的程序性記憶和包含(外顯)知識的陳述性記憶。陳述性記憶又進(jìn)一步細(xì)分為語義記憶(事實(shí)記憶)和情景記憶。
在認(rèn)知框架中,長時(shí)記憶是對于知識的長期存儲,使系統(tǒng)能夠運(yùn)行,因此幾乎所有的架構(gòu)都實(shí)現(xiàn)了程序性或語義性記憶,程序性記憶包含了在任務(wù)域中如何完成任務(wù)的知識。在符號生產(chǎn)系統(tǒng)中,程序知識由一組針對特定領(lǐng)域預(yù)編程或?qū)W習(xí)的 if-then 規(guī)則表征(3T, 4CAPS, ACT-R, ARDIS, EPIC , SAL, Soar , APEX)。
語義記憶存儲關(guān)于對象的事實(shí)和它們之間的關(guān)系。在支持符號推理的體系結(jié)構(gòu)中,語義知識通常被實(shí)現(xiàn)為圖結(jié)構(gòu)的形式,其中節(jié)點(diǎn)對應(yīng)概念,鏈接表征它們之間的關(guān)系(Disciple, MIDAS, Soar, CHREST)。在神經(jīng)架構(gòu)中,事實(shí)知識被表征為神經(jīng)網(wǎng)絡(luò)中的激活模式(BBD, SHRUTI , HTM , ART)。
4. 全局記憶(Global Memory)
盡管存在不同的記憶系統(tǒng),但一些架構(gòu)對不同類型的知識或短時(shí)記憶和長時(shí)記憶沒有單獨(dú)的表征,而是使用統(tǒng)一的結(jié)構(gòu)來存儲系統(tǒng)中的所有信息。例如,CORTEX 和 RoboCog 使用了一個(gè)集成的動態(tài)多圖對象,它可以表征感官數(shù)據(jù)和描述機(jī)器人和環(huán)境狀態(tài)的高級符號。
同樣,AIS 實(shí)現(xiàn)了一個(gè)全局記憶,它結(jié)合了知識庫、中間推理結(jié)果和系統(tǒng)的認(rèn)知狀態(tài)。DiPRA 使用模糊認(rèn)知地圖來表征目標(biāo)和計(jì)劃。NARS 在 Narcese 中以形式句的形式表現(xiàn)了所有的經(jīng)驗(yàn)知識,無論它是陳述性的、情景性的還是程序性的。類似地,在一些神經(jīng)架構(gòu)中,如 SASE 和 ART,神經(jīng)元作為工作記憶或長期記憶的作用是動態(tài)的,取決于神經(jīng)元是否被激發(fā)。
總的來說,認(rèn)知架構(gòu)中的記憶研究主要涉及記憶的結(jié)構(gòu)、表征和提取。相對來說,很少有人關(guān)注與維護(hù)大規(guī)模記憶存儲相關(guān)的挑戰(zhàn),因?yàn)橹悄艽淼挠蚝蜁r(shí)間跨度通常是有限的。相比之下,人類的記憶容量非常大。
因此,可供選擇的解決方案包括利用現(xiàn)有的大規(guī)模數(shù)據(jù)管理方法和改進(jìn)檢索算法。例如 Soar 和 ACT-R 使用 PostgreSQL 關(guān)系數(shù)據(jù)庫從 WordNet 加載概念和關(guān)系。另外,SPA 支持一種生物學(xué)上合理的聯(lián)想記憶模型,能夠使用 spike 神經(jīng)元網(wǎng)絡(luò)在 WordNet 中表征超過 100K 個(gè)概念。
學(xué)習(xí)(Learning)
學(xué)習(xí)是系統(tǒng)隨著時(shí)間的推移提高其性能的能力。歸根結(jié)底,任何形式的學(xué)習(xí)都是基于經(jīng)驗(yàn)的。例如,系統(tǒng)可能能夠從觀察到的事件或從其自身操作的結(jié)果推斷事實(shí)和行為。下圖顯示了所有認(rèn)知架構(gòu)的關(guān)于學(xué)習(xí)類型的可視化。
1. 感知學(xué)習(xí)
感知學(xué)習(xí)適用于主動改變感官信息加工方式或在線學(xué)習(xí)模式的架構(gòu)。這種學(xué)習(xí)通常用于獲得關(guān)于環(huán)境的內(nèi)隱知識,例如空間地圖(RCS, AIS, MicroPsi),聚類視覺特征(HTM , BECCA , Leabra)或發(fā)現(xiàn)感知之間的關(guān)聯(lián)。許多系統(tǒng)使用預(yù)學(xué)習(xí)組件來處理感知數(shù)據(jù),例如物體和面部檢測器或分類器。
2. 陳述性學(xué)習(xí)
陳述性知識是關(guān)于世界的事實(shí)以及它們之間定義的各種關(guān)系的集合。在許多生產(chǎn)系統(tǒng)中,如 ACT-R 等,它們實(shí)現(xiàn)了分塊機(jī)制,當(dāng)一個(gè)新的塊被添加到聲明性存儲器中時(shí)(例如,當(dāng)一個(gè)目標(biāo)完成時(shí)),新的聲明性知識就會被學(xué)習(xí)。
類似的知識獲取也在具有分布式表征的系統(tǒng)中得到了證明。例如,在 DSO 中,知識可以由人類專家直接輸入,也可以作為從標(biāo)記的訓(xùn)練數(shù)據(jù)中提取的上下文信息學(xué)習(xí)。
新的符號知識也可以通過對已知事實(shí)應(yīng)用邏輯推理規(guī)則來獲得(GMU-BICA,NARS)。
3. 程序性學(xué)習(xí)
程序性學(xué)習(xí)指的是學(xué)習(xí)技能,通過重復(fù)逐漸發(fā)生,直到技能成為自動的。最簡單的方法是積累成功解決問題的例子,以供以后重用(例如AIS , R-CAST, RoboCog)。例如,在導(dǎo)航任務(wù)中,可以保存經(jīng)過的路徑,并在以后再次用于在相同位置之間穿行(AIS)。顯然,這種類型的學(xué)習(xí)是非常有限的,需要進(jìn)一步處理積累的經(jīng)驗(yàn),以提高效率和靈活性。
基于解釋的學(xué)習(xí)(EBL)是一種常見的技術(shù),用于從許多具有符號表征的程序知識的架構(gòu)中學(xué)習(xí)經(jīng)驗(yàn)(PRODIGY, Teton, Theo, Disciple, MAX, Soar, Companions, ADAPT, ERE, REM, CELTS, RCS)。簡而言之,它允許將單個(gè)觀察到的實(shí)例的解釋概括為一般規(guī)則。
然而,EBL 并沒有擴(kuò)展問題域,而是在類似的情況下使解決問題更有效。這種技術(shù)的一個(gè)已知缺點(diǎn)是,它可能導(dǎo)致規(guī)則太多(也稱為“效用問題”),這可能會減慢推斷。為了避免模型知識的爆炸,可以應(yīng)用各種啟發(fā)式方法,例如在規(guī)則可以包含的事件上添加約束(CELTS)或消除低使用塊(Soar)。盡管 EBL 并非生物學(xué)啟發(fā),但已有研究表明,在某些情況下,人類學(xué)習(xí)可能會表現(xiàn)出類似 EBL 的行為。
符號程序性知識也可以通過歸納推理(Theo, NARS)、類比學(xué)習(xí)(Disciple, NARS)、行為調(diào)試(MAX)、概率推理(CARACaS)、關(guān)聯(lián)和外展(RCS)和顯式規(guī)則提取(CLARION)來獲得。
4. 聯(lián)想學(xué)習(xí)
聯(lián)想學(xué)習(xí)是一個(gè)廣義的術(shù)語,指受獎懲影響的決策過程。在行為心理學(xué)中,它被研究在兩個(gè)主要的范式:經(jīng)典條件反射和操作條件反射。主要形式為強(qiáng)化學(xué)習(xí)(RL)及其變體,如 temporal difference learning、Q-learning、Hebbian learning 等,常用于聯(lián)想學(xué)習(xí)的計(jì)算模型中。
有大量證據(jù)表明,基于錯(cuò)誤的學(xué)習(xí)是決策和運(yùn)動技能習(xí)得的基礎(chǔ)。強(qiáng)化學(xué)習(xí)的簡單性和效率使其成為最常見的技術(shù)之一,近一半的認(rèn)知架構(gòu)使用它來實(shí)現(xiàn)聯(lián)想學(xué)習(xí)。
RL 的優(yōu)點(diǎn)是它不依賴于表征,可以用于符號、神經(jīng)或混合架構(gòu),這種技術(shù)的主要用途之一是發(fā)展適應(yīng)性行為。在具有符號組件的系統(tǒng)中,它可以通過根據(jù)成功/失敗來改變動作和信念的重要性來實(shí)現(xiàn)(例如 RCS, NARS, REM, RALPH, CHREST, FORR, ACT-R, CoJACK)。在混合和神經(jīng)系統(tǒng)中,強(qiáng)化學(xué)習(xí)可以在狀態(tài)和行為之間建立聯(lián)系。聯(lián)想學(xué)習(xí)可以應(yīng)用于難以獲得分析解的情況下,如軟臂控制(ISAC)。
5. 非聯(lián)想學(xué)習(xí)
非聯(lián)想學(xué)習(xí)不需要把刺激和反應(yīng)聯(lián)系在一起。習(xí)慣化和敏感化通常被認(rèn)為是非聯(lián)想學(xué)習(xí)的兩種類型。習(xí)慣化是指對重復(fù)刺激的反應(yīng)強(qiáng)度逐漸降低。相反的過程發(fā)生在致敏過程中,即反復(fù)暴露于刺激會導(dǎo)致反應(yīng)增加。由于它們的簡單性,這些類型的學(xué)習(xí)被認(rèn)為是其他形式的學(xué)習(xí)的先決條件。
例如,習(xí)慣化會過濾掉不相關(guān)的刺激,幫助人們關(guān)注重要的刺激,尤其是在沒有正面或負(fù)面獎勵的情況下。迄今為止,這一領(lǐng)域的大部分工作都致力于社會機(jī)器人和人機(jī)交互環(huán)境下的習(xí)慣化,以實(shí)現(xiàn)自適應(yīng)和現(xiàn)實(shí)的行為。例如,ASMO 架構(gòu)使機(jī)器人能夠忽略不相關(guān)的(但顯著的)刺激。
在跟蹤任務(wù)中,機(jī)器人很容易被背景中的快速運(yùn)動分散注意力。習(xí)慣化學(xué)習(xí)(作為附加到運(yùn)動模塊上的增強(qiáng)值實(shí)現(xiàn))使其能夠?qū)W⒂谂c任務(wù)相關(guān)的刺激。在ASMO中,除了習(xí)慣化外,敏感化學(xué)習(xí)還允許社交機(jī)器人專注于被跟蹤對象附近的運(yùn)動,即使該運(yùn)動可能很慢且不顯著。
6. 啟動(Priming)
啟動(Priming)發(fā)生在先前暴露于刺激影響其后續(xù)識別和分類的情況下。大量實(shí)驗(yàn)證明了啟動效應(yīng)對各種刺激的存在,包括知覺、語義、聽覺等,以及行為啟動。
啟動在心理學(xué)和神經(jīng)科學(xué)中得到了很好的研究,在認(rèn)知架構(gòu)中發(fā)現(xiàn)了啟動建模的兩個(gè)主要理論框架:擴(kuò)散激活(ACT-R、Recommend、Shruti、CELTS、LIDA、ARS/SiMA、DUAL、NARS)和吸引子網(wǎng)(CLARION、Dawin.NeuralDynamic)。目前研究社區(qū)的共識是,擴(kuò)散激活具有更強(qiáng)的解釋能力,但吸引子網(wǎng)絡(luò)被認(rèn)為在生物學(xué)上更合理。在這種情況下,似乎特定范式的選擇也可能受到表征的影響。
例如,在局部架構(gòu)中發(fā)現(xiàn)了擴(kuò)散激活,其中單位對應(yīng)于概念。當(dāng)一個(gè)概念被調(diào)用時(shí),相應(yīng)的單元被激活,該激活被傳播到相鄰的相關(guān)單元,從而便于它們的進(jìn)一步使用?;蛘?,在吸引子網(wǎng)絡(luò)中,一個(gè)概念由包含多個(gè)單元的模式表征,根據(jù)模式之間的相關(guān)性(相關(guān)性),激活一種模式會導(dǎo)致其他模式的激活增加。
推理(Reasoning)
推理是心理學(xué)和認(rèn)知科學(xué)的焦點(diǎn)之一,作為一種邏輯和系統(tǒng)加工知識的能力,推理幾乎可以影響或組織任何形式的人類活動。因此,除了經(jīng)典的三種邏輯推理(演繹、歸納和外推)之外,其他類型的推理現(xiàn)在正在被考慮,如啟發(fā)式、可消除推理、類比推理、敘事推理、道德推理等。
可以預(yù)見的是,所有認(rèn)知架構(gòu)都與實(shí)踐推理有關(guān),其最終目標(biāo)是找到下一個(gè)最佳行動并執(zhí)行它。在認(rèn)知架構(gòu)的背景下,推理主要涉及規(guī)劃、決策和學(xué)習(xí),以及感知、語言理解和問題解決。
人類以及任何具有人類智力水平的人經(jīng)常面臨的主要挑戰(zhàn)之一是在知識不足的基礎(chǔ)上采取行動,或者說“在普遍無知的背景下做出理性決定”。除了稀疏的領(lǐng)域知識外,可用的內(nèi)部資源(如信息加工能力)也有局限性。
迄今為止,最集中的努力是用于克服在不斷變化的環(huán)境中知識和(或)資源不足的問題。事實(shí)上,這是通用推理系統(tǒng)的目標(biāo),例如過程推理系統(tǒng)(PRS)、非公理推理系統(tǒng)(NARS)、OSCAR 和具有有限性能硬件的 Rational 代理(RALPH)。
PRS 是 BDI (信念-預(yù)期-意圖)模型最早的例子之一,在每個(gè)推理周期中,它選擇一個(gè)與當(dāng)前信念匹配的計(jì)劃,將其添加到意圖堆棧中并執(zhí)行它。如果在執(zhí)行過程中產(chǎn)生了新的目標(biāo),就會產(chǎn)生新的意圖。NARS 通過迭代地重新評估現(xiàn)有證據(jù)并相應(yīng)地調(diào)整其解決方案來解決知識和資源不足的問題。這在非公理邏輯(Non-Axiomatic Logic)中是可能的,它將真值與每個(gè)語句關(guān)聯(lián)起來,從而允許智能體表達(dá)他們對信念的信心。
RALPH 利用決策理論的方法解決復(fù)雜領(lǐng)域中復(fù)雜的目標(biāo)驅(qū)動行為,因此,計(jì)算等同于行動,效用值(基于其預(yù)期效果)最高的行動總是被選擇。OSCAR 架構(gòu)探索了可消除的推理,即理性上令人信服但不演繹有效的推理,這是對日常推理的一種更準(zhǔn)確的表征,在這種情況下,知識很少,任務(wù)復(fù)雜,沒有衡量成功的特定標(biāo)準(zhǔn)。
上面提到的所有架構(gòu)都旨在創(chuàng)建具有人類智能水平的理性系統(tǒng),但它們不一定試圖模擬人類的推理過程。而 ACT-R、Soar、DUAL 和 CLARION 等架構(gòu)的目標(biāo),則試圖模擬人類推理過程。特別是,在 ACT-R 中實(shí)現(xiàn)的人類推理模塊是在假設(shè)人類推理是概率性和歸納性的前提下工作的。這是通過將基于規(guī)則的確定性推理機(jī)制與具有類似人類記憶屬性的長期陳述性記憶(即不完整和不一致的知識)相結(jié)合來證明的。知識和產(chǎn)生式規(guī)則中固有的不確定性共同促成了類似人類的推理行為。
人類高級認(rèn)知是否具有固有的符號化仍然沒有解決。到目前為止所考慮的符號和混合架構(gòu),主要將推理視為一種符號操作。許多新興的基于神經(jīng)的體系結(jié)構(gòu),例如ART、HTM、DAC、BBD、BECCA,似乎根本不加工推理,盡管它們確實(shí)表現(xiàn)出復(fù)雜的智能行為。
迄今為止,神經(jīng)架構(gòu)中符號推理(以及其他低級和高級認(rèn)知現(xiàn)象)最成功的實(shí)現(xiàn)之一是由 SPA 表征的。像這樣的架構(gòu)也提出了有趣的問題,嘗試將認(rèn)知的符號部分與子符號部分分開是否有意義。由于大多數(shù)現(xiàn)有的認(rèn)知架構(gòu)代表了從純符號到連接主義的連續(xù)統(tǒng)一體,人類認(rèn)知可能也是如此。
元認(rèn)知(Metacognition)
元認(rèn)知,直觀地定義為“對思考的思考”,是一組內(nèi)省地監(jiān)控內(nèi)部過程并對其進(jìn)行推理的能力。由于元認(rèn)知在人類經(jīng)驗(yàn)中的重要作用,以及識別、解釋和糾正錯(cuò)誤決策的實(shí)際必要性,人們對開發(fā)人工智能體的元認(rèn)知越來越感興趣。本文中大約三分之一的架構(gòu),主要是具有重要符號組件的符號架構(gòu)或混合架構(gòu),支持與決策和學(xué)習(xí)有關(guān)的元認(rèn)知。
元認(rèn)知機(jī)制包括自我觀察、自我分析和自我調(diào)節(jié)。其需要收集有關(guān)系統(tǒng)內(nèi)部操作和狀態(tài)的數(shù)據(jù)數(shù)據(jù),這些數(shù)據(jù)通常包括內(nèi)部資源的可用性/需求(AIS, COGNET , Soar)和當(dāng)前任務(wù)知識(CLARION, CoJACK , Companions, Soar)。
此外,一些架構(gòu)支持當(dāng)前和/或過去解決方案的時(shí)間表征(跟蹤)(Companions, Metacat, MIDCA)。收集數(shù)據(jù)的數(shù)量和粒度取決于進(jìn)一步的分析和應(yīng)用,在決策應(yīng)用中,在確定了可用資源的數(shù)量、沖突的資源請求、條件的差異等之后,系統(tǒng)可能會改變不同任務(wù)/計(jì)劃的優(yōu)先級(AIS、CLARION、COGNET、CoJACK、MAMID、PRODIGY、RALPH)。
對過去問題的執(zhí)行和/或記錄解決方案的跟蹤可以促進(jìn)學(xué)習(xí)。例如,可以利用過去解決方案中發(fā)現(xiàn)的重復(fù)模式來減少未來類似問題的計(jì)算(Metacat, FORR, GLAIR, Soar)。
盡管理論上許多體系結(jié)構(gòu)都支持元認(rèn)知,但它的實(shí)用性只在有限的領(lǐng)域得到了證明。例如,Metacat 將元認(rèn)知應(yīng)用于微觀領(lǐng)域的類比推理字符串(例如 ABC→abd; MRRJJJ→?)。元認(rèn)知允許系統(tǒng)記住過去的解決方案,比較不同的答案并證明其決策是正確的。
在 PRS 中,元認(rèn)知能夠在玩《奧賽羅》等游戲時(shí)有效地解決問題,更好地控制模擬車輛以及對不斷變化的環(huán)境的實(shí)時(shí)適應(yīng)。元認(rèn)知可以進(jìn)行內(nèi)部錯(cuò)誤監(jiān)控,即實(shí)際和預(yù)期感知輸入之間的比較,使系統(tǒng)能夠確定其操作在簡單任務(wù)中的成功或失敗,例如堆疊塊,并在未來學(xué)習(xí)更好的操作。
元認(rèn)知是社會認(rèn)知所必需的,尤其是心理學(xué)文獻(xiàn)中所說的心理理論(Theory of mind, ToM)。ToM 指的是能夠承認(rèn)和理解他人的心理狀態(tài),利用對他人心理狀態(tài)的判斷來預(yù)測他們的行為,并為自己的決策提供信息。
很少有體系結(jié)構(gòu)支持這種能力。例如,最近,Sigma 演示了 ToM 的兩種不同機(jī)制,并將其作為幾個(gè)單階段同時(shí)移動游戲的例子,例如著名的囚徒困境。第一種機(jī)制是自動的,因?yàn)樗婕暗骄W(wǎng)格圖的概率推理,第二種機(jī)制是跨問題空間的組合搜索。
PolyScheme 將 ToM 應(yīng)用于人機(jī)交互場景中的視角獲取,在這個(gè)場景中,機(jī)器人和人類一起在一個(gè)有兩個(gè)交通錐和多個(gè)遮擋元素的房間里。這個(gè)人發(fā)出一個(gè)命令,向一個(gè)圓錐移動,但沒有指明是哪個(gè)圓錐。如果人類只能看到一個(gè)錐體,機(jī)器人可以從人類的視角建模場景,并使用該信息消除命令的歧義。
另一個(gè)例子是在錯(cuò)誤信念任務(wù)中對信念進(jìn)行推理。在這個(gè)場景中,兩個(gè)代理 A 和 B 觀察到一個(gè)放在罐子里的餅干。B 離開后,餅干被移到另一個(gè)罐子里。當(dāng) B 回來時(shí),A 可以推斷 B 仍然相信餅干仍然在第一個(gè)罐子里。
問題與挑戰(zhàn)(Problems and challenges)
1. 感知問題
在嘈雜的非結(jié)構(gòu)化環(huán)境中運(yùn)行的機(jī)器人架構(gòu)中,感知問題最為嚴(yán)重。經(jīng)常提到的問題包括缺乏主動視覺、精確的定位和跟蹤、噪聲和不確定性下的穩(wěn)健性能以及利用上下文信息來改進(jìn)檢測和定位。
最近,深度學(xué)習(xí)被認(rèn)為是自下而上感知的可行選擇,總的來說,與更高層次的認(rèn)知能力相比,對感知的加工,特別是對視覺的處理,無論是在捕捉潛在的過程還是實(shí)際應(yīng)用方面,都是相當(dāng)膚淺的。其他感覺方式,如聽覺、本體感覺和觸覺,通常依賴于現(xiàn)成的軟件解決方案,或者通過物理傳感器/模擬來實(shí)現(xiàn)。支持它的架構(gòu)中的多模態(tài)感知是機(jī)械地處理的,是為特定的應(yīng)用程序量身定制的。最后,知覺與高層次認(rèn)知之間自下而上和自上而下的相互作用在理論和實(shí)踐中都被忽視了。
2. 學(xué)習(xí)問題
盡管各種類型的學(xué)習(xí)在認(rèn)知架構(gòu)中都有體現(xiàn),但仍然需要開發(fā)更健壯和靈活的學(xué)習(xí)機(jī)制、知識遷移,以及在不影響先前學(xué)習(xí)的情況下積累新知識。學(xué)習(xí)對于認(rèn)知建模的發(fā)展方法尤其重要,特別是運(yùn)動技能和陳述性知識。自然的溝通,言語交流是人工智能體與人類之間最常見的互動方式,基于這個(gè)方式的學(xué)習(xí)通常缺乏穩(wěn)健性。
3. 記憶問題
盡管記憶是任何計(jì)算模型的必要組成部分,在認(rèn)知架構(gòu)領(lǐng)域得到了很好的表現(xiàn)和研究,但相對而言,情景記憶還沒有得到充分的研究。這種記憶結(jié)構(gòu)的存在早在幾十年前就已經(jīng)為人所知,它對學(xué)習(xí)、交流和自我反思的重要性也得到了廣泛的認(rèn)可,然而,在認(rèn)知的計(jì)算模型中,情景記憶仍然相對被忽視。對于人類思維的一般模型,如 Soar 和 ICARUS,也是如此,最近才納入它。
目前,大多數(shù)架構(gòu)將事件保存為帶有時(shí)間戳的系統(tǒng)狀態(tài)快照。這種方法適用于生命周期短、表征細(xì)節(jié)有限的智能體,但終身學(xué)習(xí)和管理大規(guī)模內(nèi)存存儲需要更精細(xì)的解決方案。
4. 計(jì)算性能
由于顯而易見的原因,計(jì)算效率問題在機(jī)器人架構(gòu)和交互式應(yīng)用中更加緊迫。時(shí)間和空間的復(fù)雜性在文獻(xiàn)中被掩蓋了,經(jīng)常用定性的術(shù)語來描述(例如“實(shí)時(shí)的”,沒有具體細(xì)節(jié))或完全從討論中省略。一個(gè)相關(guān)的問題是規(guī)模問題。事實(shí)證明,將現(xiàn)有算法擴(kuò)展到更大量的數(shù)據(jù)會帶來額外的挑戰(zhàn),例如需要更有效的數(shù)據(jù)處理和存儲。這些問題目前只有少數(shù)架構(gòu)可以解決,盡管解決這些問題對于進(jìn)一步發(fā)展理論和應(yīng)用人工智能至關(guān)重要。
5. 評估系統(tǒng)
認(rèn)知架構(gòu)的比較評價(jià),共同承認(rèn)的問題的解決取決于制定客觀和廣泛的評價(jià)程序。我們已經(jīng)提到的問題之一是,單個(gè)體系結(jié)構(gòu)是使用一組脫節(jié)和稀疏的實(shí)驗(yàn)來驗(yàn)證的,這不能支持關(guān)于系統(tǒng)能力的聲明,也不能充分評估其表征能力。然而,在架構(gòu)之間進(jìn)行比較和測量該領(lǐng)域的總體進(jìn)展需要額外的挑戰(zhàn)。
構(gòu)建一個(gè)認(rèn)知架構(gòu)是一個(gè)重大的課題,甚至需要數(shù)年的開發(fā)來將基本的組件放在一起(在我們的樣本中,項(xiàng)目的平均年齡約為 15 年),隨著時(shí)間的推移,任何重大更改都變得更加困難。因此,評價(jià)對于確定更有前景的方法和剔除次優(yōu)勘探路徑至關(guān)重要。
在某種程度上,通過理論考慮和多年來積累的集體經(jīng)驗(yàn),它已經(jīng)有機(jī)地發(fā)生了。例如,曾經(jīng)占主導(dǎo)地位的符號表征正在被更靈活的神經(jīng)表征方法所取代,或者被子符號元素所增強(qiáng)(例如Soar,REM)。顯然,需要更一致和更有針對性的努力,以使這一進(jìn)程更快和更有效。
理想情況下,適當(dāng)?shù)脑u估應(yīng)該針對認(rèn)知架構(gòu)的每個(gè)方面,使用理論分析、軟件測試技術(shù)、基準(zhǔn)測試、主觀評估和挑戰(zhàn)的組合。所有這些已經(jīng)被少量地應(yīng)用到單個(gè)體系結(jié)構(gòu)中。例如,最近對主要認(rèn)知架構(gòu)中使用的知識表征的理論檢查揭示了它們的局限性,并提出了修正它們的方法。
通過一系列任務(wù)探測多種能力的測試被建議用于評估認(rèn)知架構(gòu)和通用 AI 系統(tǒng)。一些例子包括,“認(rèn)知十項(xiàng)全能”和 I-Athlon,它們都受到圖靈測試的啟發(fā),以及檢查智力因素的卡特爾-霍恩-卡羅爾模型或 Samsonovich 等人提出的用于評估不同認(rèn)知維度的一系列測試。然而,這一領(lǐng)域的大部分工作仍停留在理論上,尚未產(chǎn)生可執(zhí)行的具體建議或完整的框架。
版權(quán)說明:
本文僅代表作者個(gè)人觀點(diǎn),版權(quán)歸原創(chuàng)者所有。部分圖片源自網(wǎng)絡(luò),未能核實(shí)歸屬。本文僅為分享,不為商業(yè)用途。若錯(cuò)標(biāo)或侵權(quán),請與我們聯(lián)系刪除。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

