Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101
AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
由 TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
YouTube | Facebook | 回 GitHub Pages | 網站 | Hugging Face Space
2019/02/15, Chin-Hui Chen, Deep knowledge representation and reasoning
Deep knowledge representation and reasoning: From Expert Systems to Modern Approaches
2019/02/15 Chin-Hui Chen
在人工智慧發展的早期階段,據稱大約在1970年代到1980年代 [1, 3],專家系統 (Expert Systems) 是主流方法之一 [1]。對於入門的同學,你可以把它想像成一個試圖模仿人類專家的思考過程來解決特定問題的電腦程式 [1]。
核心原理:基於規則與符號
專家系統的基礎是一系列的邏輯規則 [1]。這些規則通常以「如果 (If) ... 則 (Then) ...」的形式存在,用來定義在特定條件下應該採取的行動或推導出的結論 [1]。系統會根據輸入的事實去匹配這些規則,進行邏輯推論 [1]. 來源中也提到,這些規則需要手動建立 [4, 5].
主要的挑戰與侷限:
標準化與結構化的嘗試
為了解決手工建構和缺乏標準化的問題,學界曾嘗試引入一些標準化的技術 [3, 6],例如 OWL (Web Ontology Language) 和 RDF (Resource Description Framework) [1, 4]. 曼徹斯特大學 (University of Manchester) 在2011年左右是開發OWL的代表之一 [3],可能也開發過相關軟體,例如一個名為 Port 的軟體 [3, 5]. 這些技術試圖提供一種更有結構、更標準化的方式來表示知識 [1, 4],例如定義概念、屬性以及它們之間的關係 [4]. 一些工具(例如被稱為「Page」或「Port」的軟體 [5, 7],結合 SWRL (Semantic Web Rule Language) [5, 7])也應運而生,允許建立結構化的關係並進行推論 [5, 7]. 例如,可以建立「A 是 B 的爸爸」這樣的二元關係 [5],並通過規則推論出 A 和 C(B 的媽媽)之間的關係 [5]. 來源提到,這種推論是基於已定義的關係,而不是因果關係 [8].
然而,即使有了 OWL 這樣的工具,早期的知識庫仍然存在限制 [4]. 它們通常只能建立有限種類的關係 [4],例如本體論中的屬性關聯或簡單的二元關係 [4, 5]. 雖然可以進行簡單的邏輯推論 [5, 7],但要處理更複雜、更抽象或在開放領域 (Open Domain) 中未見過的名詞和關係時,仍然非常困難 [4, 5, 7]. 來源中提到,那個年代即使使用了這些標準化工具,在開放領域仍然沒有辦法做好,只是不需要完全手動鍵而已 [5]. 這促使一些研究者甚至嘗試開發新的語言(如「FM language」)[6, 7, 9],試圖將「黎」的概念引入來增強關係的表示能力 [6, 7],這顯示出大家已經意識到僅靠簡單的結構化關係是不足夠的 [7].
面對專家系統在處理不確定性、語義多樣性 [1, 4] 和擴展性 [1, 4] 方面的根本性挑戰,研究方向開始轉向 [2]. 雖然來源中沒有在關鍵比較點明確提及「詞向量」,但其對近代方法能力的描述 [1, 2],與詞向量 (Word Embeddings) 的核心思想高度契合。
核心原理:將詞彙映射到向量空間
近代的方法,特別是像詞向量這樣的技術,其核心思想是將每一個詞彙或符號不再視為孤立的單元,而是將它們映射到一個連續的數學向量空間中 [1, 2]. 每個詞彙都由空間中的一個高維向量來表示 [1, 2]. 來源中也提到了向量和矩陣運算的概念 [10, 11],這與這種表示方式是相符的 [10, 11].
詞向量的優勢與能力:
從專家系統到詞向量這類方法的轉變,是人工智慧領域一次深刻的範式轉移 [2]. 它標誌著從早期的符號主義 (Symbolism) 方法(強調用邏輯規則和符號表示知識 [2])向連接主義 (Connectionism) 或說數據驅動 (Data-driven) 方法(強調從數據中學習,用向量等連續表示來捕捉模式 [2])的演進。
專家系統因其僵化的零一邏輯 [1, 4]、難處理不確定性與語義多樣性 [1, 4],以及對人工知識建構的依賴 [1, 4] 而面臨嚴峻挑戰 [1, 2]. 近代方法通過將詞彙等信息表示在連續的向量空間中 [1, 2],利用大規模數據學習的能力 [2],更靈活和強大地捕捉語義關聯和處理複雜語言現象 [1, 2]. 這種轉變不僅是技術上的進步 [2],也反映了我們對如何表示和處理知識有了更深入的理解 [2]. 對於初學者而言,理解這兩種方法在核心思想和處理能力上的根本差異 [1, 2, 4, 10],是掌握當前自然語言處理技術發展脈絡的關鍵一步 [1, 2].