Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程，花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗；如欲移除資訊還請告知。
由 TonTon Huang Ph.D. 發起，及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷，是為了普及與分享深度學習及AI領域的尖端知識，深信AI的價值在於解決真實世界的商業問題。

大語言模型	語音處理	自然語言處理	電腦視覺
Large Language Model	Speech Processing	Natural Language Processing, NLP	Computer Vision

用 AI 懂 AI

AI 技術體驗/分享

手把手帶你一起踩 AI 坑：https://www.twman.org/AI

手把手AI 技術深度實戰教學/開源/試用

AI x Cyber-Security

Recommender System YouTube

2018/09/14 SAS

主要的推薦方法類型

推薦系統的建構方法大致可以分為幾種主要類型，這些是我們入門時需要掌握的基礎：

Content-Based Filtering (內容基礎過濾)
- 這種方法主要依賴於商品/內容本身的特徵（metadata, features）和使用者的特徵來進行推薦 [1-3]。
- 商品特徵可能包括標題、內容、類別、價格等 [1-3]。
- 使用者特徵則可能包括年齡、性別、個人喜好等 [1, 2]。
- 其基本思路是將這些特徵作為模型輸入，預測使用者對特定項目的偏好 [1-3]。
- 從研究角度看，這可以視為一個基於特徵的預測問題，例如使用簡單的迴歸模型 [1]。
- 挑戰在於，有時候使用者特徵難以獲取（例如，網站不一定知道使用者的年齡或性別），而商品特徵也可能不夠豐富或難以量化 [1, 4]。
Collaborative Filtering (CF, 協同過濾)
- CF 方法則走了一條不同的路徑：它不直接依賴於商品或使用者的顯性特徵，而是純粹利用使用者的行為數據來進行推薦 [1, 2]。這些行為數據可能是瀏覽、購買、點擊或明確的評分 [1-5]。
- 在最簡化的情況下，原始數據可能只有 User ID、Item ID 和對應的行為或評分 [1, 4]。
- 其核心假設是「物以類聚，人以群分」：相似的使用者會對相似的物品給予相似的評價或展現相似的偏好；反之，相似的物品也會被相似的使用者給予相似的評價或展現相似的偏好 [1-3, 6]。這是理解CF的基石。
- Netflix Prize 競賽是一個經典的例子，它提供了大量的使用者電影評分數據，參賽者需要預測使用者對未評分電影的偏好，這是一個典型的基於評分的 CF 問題 [2-5, 7]。

CF的子類型：記憶基礎與模型基礎

協同過濾方法又可以進一步細分為記憶基礎 (Memory-Based) 和模型基礎 (Model-Based) 兩種：

Memory-Based (記憶基礎): 這類方法直接使用原始的使用者行為數據（如評分矩陣）來計算相似度並生成推薦。
- User-Based CF: 計算使用者之間的相似度（例如使用 Cosine similarity 或 Pearson correlation 等度量方法），然後基於與目標使用者相似的其他使用者對某個物品的評分，進行加權平均來預測目標使用者對該物品的評分 [1, 6]。
- Item-Based CF: 計算物品之間的相似度，然後基於目標使用者對與目標物品相似的其他物品的評分，進行加權平均來預測使用者對目標物品的評分 [1, 8]。
- 在實際應用中，Item-Based CF 在許多方面展現出優勢。特別是當物品數量（Item）遠少於使用者數量（User）時，計算物品相似度的計算量可能較少 [1, 8]。此外，物品之間的相似度相對穩定，而使用者偏好可能變化較快 [1, 8]。另一個關鍵優勢在於Serving (線上服務)：Item 相似度可以預先計算並儲存，當用戶有新的行為時，可以快速查找相似物品進行推薦，這在實時推薦場景下非常重要 [1, 8, 9]。Amazon 或 HP 的研究人員被認為在這個領域做出了重要貢獻，Item-Based CF 的創新性甚至獲得過獎項 [1, 5, 8, 10]。
- Memory-Based 方法的局限性在於，它的預測過程是基於相似度計算和加權平均，這可能限制了模型的表達能力，且相似度的定義可能與最終預測目標沒有直接的優化關聯 [1, 9]。同時，對於像 Harry Potter 系列這樣有多集的內容，簡單的相似度計算可能導致不準確，因為看過一集和看過多集的使用者其真實興趣強度可能被扭曲 [1, 9]。
Model-Based (模型基礎): 這類方法則嘗試學習一個模型來概括使用者與物品之間的關係。
- Matrix Factorization (MF, 矩陣分解): 這是模型基礎CF中最經典且影響深遠的方法之一 [1, 2, 11, 12]。
- 核心思想：將使用者-物品互動（如評分）矩陣分解為兩個低維的矩陣：一個是使用者隱含特徵矩陣（或稱使用者 Embedding），另一個是物品隱含特徵矩陣（或稱物品 Embedding）[1-3, 11, 12]。使用者對物品的評分（或偏好）被建模為對應的使用者隱含向量和物品隱含向量的內積 [1-3, 11, 12]。直觀來說，這些隱含向量捕捉了使用者和物品在某些未知的「維度」上的特徵，例如使用者對「動作片」的偏好強度和某部電影是「動作片」的程度 [1, 12]。
- 訓練過程：通過定義一個目標函數（通常是最小化預測評分與實際評分之間的誤差，例如 RMSE/MSE），並通過優化算法來學習得到最佳的使用者 Embedding 矩陣 (P) 和物品 Embedding 矩陣 (Q) [1, 3, 12, 13]。
- 求解方法：常用的優化算法包括：
  - Alternating Least Squares (ALS): 迭代地固定使用者矩陣求解物品矩陣，再固定物品矩陣求解使用者矩陣，重複進行直到收斂 [1, 3, 11-13]。ALS的優勢在於相對容易進行分散式計算，適合處理大規模數據 [1, 13]。
  - Stochastic Gradient Descent (SGD): 一種通用的優化算法，也可以用於訓練 MF 模型 [1, 3, 11, 12]。
- 改進：MF 模型可以通過加入Bias 項（例如，某些使用者傾向於給高分，某些物品普遍得分較高）和正規化項（防止過擬合）來提升性能 [1, 13]。此外，也可以通過加入其他特徵（如商品類別、時間因素）來擴展模型 [1, 13-15]。
- MF 本質上與 Autoencoder 有相似之處，可以視為一種降維和重建使用者-物品互動矩陣的方法 [1, 6, 16]。
- 其他模型：除了 MF，PLSA、RBM（受限玻爾茲曼機）等模型也可以用於推薦系統 [1, 6].

處理隱性回饋 (Implicit Feedback)

在實際應用中，我們往往沒有使用者明確的評分數據 (Explicit Feedback)，更多的是隱性回饋，例如瀏覽、點擊、購買等行為 [1, 3, 11, 14, 17, 18]。這類數據的挑戰在於：

只有正面樣本：我們知道使用者對哪些項目產生了行為，但對於那些沒有行為的項目，我們不確定是使用者不感興趣，還是根本沒有看到或注意到 [1, 3, 14, 17, 18]。這不像評分數據，我們可以明確知道使用者「不喜歡」某個項目。
缺乏程度信息：即使使用者與某個項目發生了互動（如瀏覽），我們也無法直接得知其喜歡的程度，不像評分有1-5分的分級 [1, 18]。

處理隱性回饋的常用方法包括 [1, 3, 14, 15, 17]:

將有行為的項目標記為 1（正面樣本），沒有行為的項目標記為 0（負面樣本）。
在模型訓練時，給予這些未觀測到的「0」樣本較小的權重，以反映其不確定性 [1, 3, 14, 15, 17]。
這種處理方式可以應用於 MF 或其他模型。

進階的推薦方法與技術

隨著研究的深入和數據的複雜化，出現了更多先進的推薦系統方法：

Word2Vec 等 Embedding 方法的應用: 將使用者瀏覽或互動的物品序列視為一個「句子」，將物品視為「詞」[1, 14, 16]。應用 Word2Vec (如 Skip-gram) 或其變種（如 Meta-Prod2Vec）來學習物品的 Embedding 向量 [1, 14, 16]。這樣可以將物品轉換為低維度的密集向量表示，捕捉物品之間的語義或關聯性 [1, 14, 16]。如果將使用者行為表達為圖結構，也可以使用 Node2Vec 等圖嵌入方法 [1, 16]。
深度學習 (Deep Learning, DL): DL 模型可以構建更深層次的結構，以學習使用者和物品之間更複雜的交互關係和抽象高層次特徵 [1, 14, 16].
- Wide & Deep Learning (Google): 結合了 Wide 部分（類似線性模型，擅長記憶處理稀疏的交叉特徵）和 Deep 部分（深度神經網絡，擅長從特徵中泛化學習隱含模式），旨在結合兩者的優勢以獲得更好的性能 [1, 14, 16].
- RNN (循環神經網絡): 在序列推薦中表現出色。將使用者的瀏覽或購買歷史視為一個序列，RNN 可以捕捉使用者興趣的短期或長期演變，特別適用於 Session-based 推薦，即根據使用者在一個特定時間段內的行為序列進行推薦 [1, 11, 14, 19]. Session 的定義通常基於時間間隔（如 30 分鐘無活動則 Session 結束）[7, 11, 19].
強化學習 (Reinforcement Learning, RL): 將推薦過程建模為一個序列決策問題，智能體（推薦系統）在不同的狀態（使用者當前的狀態/瀏覽歷史）下採取動作（推薦物品），並根據使用者的反應獲得獎勵（點擊、購買等），目標是學習一個策略來最大化長期的累積獎勵 [1, 11, 14, 19-21].
- 淘寶有將整個購物流程視為一個RL過程，優化使用者最終購買的機率的應用案例 [1, 14, 19].
- 挑戰：RL 需要大量的在線互動試錯來學習，這在實際線上環境中成本很高且風險大 [1, 22]. 數據稀疏和 Off-policy Evaluation (在舊策略下評估新策略) 也是難點 [1, 20, 22].

其他相關概念與考量

模型融合 (Ensembling): 在 Netflix Prize 競賽後期，獲勝隊伍通過融合多個模型的結果來提升性能，這是一種常見的提高推薦效果的技術 [5, 7, 13, 18]. 對於L2損失優化的模型，可以直接對模型輸出進行L2插值融合 [7, 18].
跨領域推薦: 利用不同領域的數據（如閱讀和購買行為）來增強推薦效果 [5, 15]. 可以通過共享使用者 Embedding 或正則化關聯不同領域的 Embedding 來實現 [5, 15].
社交推薦: 利用使用者之間的社交關係來進行推薦，例如朋友喜歡的東西可能也推薦給你 [7, 10, 32]. 這方面資料來源未詳細展開，但作為一種潛在方向被提及，甚至有透過操縱社交推薦系統來增加個人曝光的案例 [10, 32].
推薦系統與 SEO 的差異: 推薦系統是主動向使用者推送可能感興趣的內容，而 SEO 旨在優化網站在特定搜尋詞下的排名，兩者目標和機制不同 [7, 32].