Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷,是為了普及與分享深度學習及AI領域的尖端知識,深信AI的價值在於解決真實世界的商業問題。

Deep Learning 101 TonTon H.-D. Huang Ph.D.

📚 LLM 大語言模型・必讀資源總整理

編者按: 本頁面彙整目前最主流的 LLM 排行榜、開源模型、推論與微調工具,以及相關學術論文。

如果您想尋找更詳細的筆記,歡迎訪問 GitHub Repository: 👉 GitHub: Natural-Language-Processing-Paper (歡迎 Star ⭐)



✨LLM API Platform Price Comparison

大型語言模型API平台價格比較

平台 模型 輸入費用 (USD/1M Tokens) 輸出費用 (USD/1M Tokens) 上下文窗口 免費層級 最大速率限制 (RPM / TPM) 多模態能力 特點 / 說明 定價連結
OpenAI OpenAI o1 $15.00 $60.00 200k 不公開 ✅(文字+圖像) Frontier 模型,支援 Vision/Tools/結構化輸出 OpenAI Pricing
OpenAI OpenAI o3-mini $1.10 $4.40 200k 不公開 成本效益模型,適合編碼與數學 同上
Google Gemini 2.5 Pro (Preview) $1.25(≤200k),$2.50(>200k) $10.00(≤200k),$15.00(>200k) >200k ✅(指定模型) 150 RPM / 2M TPM(Tier 1) ✅(文字+圖像) 高階推理力,企業級用途 Gemini API / Gemini 網站
Google Gemini 2.0 Flash $0.10(圖文影),$0.70(音訊) $0.40 1M ✅(15 RPM) 2,000 RPM / 4M TPM ✅(文字+圖+影+音) 多模態支援,企業級速率與穩定性 同上
Google Gemini 2.0 Flash Lite $0.075(全模態) $0.30 1M ✅(30 RPM) 4,000 RPM / 4M TPM ✅(全模態) 超高速率、經濟型多模態模型 同上
DeepSeek deepseek-chat (V3) $0.27 $1.10 64K 不公開 標準價,推理速度佳 DeepSeek Pricing / DeepSeek Chat
DeepSeek deepseek-reasoner (R1) $0.55 $2.19 64K 不公開 高階邏輯推理與數據分析能力 同上
Qwen Qwen-Max $1.60 $6.40 ~32K 不公開 強推理型,偏向高品質產出 Qwen Chat
Qwen Qwen-Plus $0.40 $1.20 ~131K 不公開 均衡型模型,支援較長上下文 同上
Grok grok-3 $3.00 $15.00 131k 不公開 支援思考模式、有限搜尋功能 Grok 官網
百度 文心一言(ERNIE Bot) 不公開(免費使用) 不公開(免費使用) 不公開 不公開 ✅(圖像/語音) 支援中文語境與多模態任務 文心一言

文章目錄


Leaderboards

🏆 排行榜 (Leaderboards)


NVIDIA Nemotron


Fine-tuning

🛠️ 微調技術與資源 (Fine-tuning)

顯存估算 (VRAM)

微調/蒸餾技術教學

微調框架 (Frameworks)

資料集準備 (Datasets)


AI-Agent

🧩 AI Agent 開源框架

完整列表請見:避開 AI 代理 (AI Agents) 與 代理式人工智慧 (Agentic AI) 開發陷阱

核心概念與必讀文章

Agent 框架列表 (按時間排序)


Tools

🛠️ 開發工具 (Tools & Protocols)

RAG (Retrieval Augmented Generation)

MCP (Model Context Protocol)


Browser Automation (瀏覽器自動化 / Manus / RPA 開源替代品)

框架/工具名稱 開發團隊/生態 💡 解決什麼痛點? (核心優勢) 🚀 推薦適用場景 & 規格標籤
OpenClaw 🌐 開源社群 跑在本地的 AI 助手。強調在地端環境運行,保障隱私與資料安全。 本地端資料處理、隱私優先企業
[本地部署] [隱私安全]
Browser-use 🌐 國際開源社群 讓 AI 像人一樣上網。支援錄製工作流,一次錄製永久自動操作網頁。 網頁自動化測試、動態網頁爬蟲
[瀏覽器自動化] [可錄製]
Gemini Computer Use 🇺🇸 Google 直接操控作業系統。Google 官方推出的代理工具,讓 AI 能直接理解並操作你的電腦介面。 跨 APP 自動化操作、系統級 RPA
[Google生態] [系統控制]
OmniParser 🇺🇸 Microsoft 精準解析 UI 元素。微軟開源的強大視覺智能體,能看懂手機與電腦畫面的按鈕與架構。 UI 自動化測試、多模態輸入
[微軟開源] [UI解析]
OpenManus / suna 🇨🇳/🌐 開源社群 Manus 的開源平替。解決商用 Agent 昂貴的問題,提供高度相似的任務執行能力。 個人開發者、快速概念驗證
[Manus平替] [低成本]

深度研究 (Deep Research) 與多智能體工作流

框架/工具名稱 開發團隊/生態 💡 解決什麼痛點? (核心優勢) 🚀 推薦適用場景 & 規格標籤
Tongyi DeepResearch 🇨🇳 阿里巴巴 開源版深度研究。通義全面開源,標榜效能超越 OpenAI 的閉源研究框架。 學術文獻統整、深度產業報告生成
[大廠開源] [深度研究]
Agno 🌐 開源社群 高效能 Multi-agent。專注於多個 AI 智能體之間的協作與任務分發。 複雜專案拆解、軟體開發協作
[多智能體] [高效能]
FlowGram 🇨🇳 字節跳動 Coze 核心引擎開源。強大的視覺化工作流引擎,適合構建複雜的邏輯鏈。 企業級 AI 服務編排、Chatbot 後台
[工作流引擎] [可視化]
AutoAgent 🇭🇰 香港大學 學術界最強大腦。港大打造的開源 Deep Research 工具,學術底蘊深厚。 大學研究室、論文自動化分析
[學術開源] [文獻分析]

效率工具 (Efficiency Tools)


AI PTT

🌍 AI PPT (用AI做PPT)


🌍 知識管理革命:開源 AI PPT 與 NotebookLM 替代方案

專案名稱 分類 💡 解決什麼痛點? (核心優勢) 🚀 推薦適用場景 & 規格標籤
notebooklm-py / Notex NotebookLM 平替 隱私優先的知識庫。提供類似 NotebookLM 的互動體驗,但支援命令列操作與本地部署。 企業內部文件庫、個人離線筆記本
[開源平替] [重視隱私]
PageLM NotebookLM 平替 互動式學習神器。把學習材料丟進去,自動生成互動式學習內容。 教育培訓、長篇報告快速消化
[互動學習] [文件分析]
Edit-Banana AI PPT 像素級逆向還原。不直接生圖,而是理解、規劃再優化,打通 AI 簡報落地的最後一哩路。 專業商業簡報、學術海報生成
[高質感排版] [學術開源]
MultiAgentPPT AI PPT 多智能體協作生 PPT。利用多個 Agent 並發處理大綱、文案與排版,速度極快。 急件簡報製作、大綱快速展開
[多智能體] [自動排版]

NotebookLM 平替

🌍 NotebookLM 平替


World Models

🌍 World Models (世界模型)


MoE

🧠 MoE (混合專家模型)


SLM

📱 Small Language Models (小型語言模型)


Reasoning

🤔 Reasoning Models (推理模型)

🧠 次世代 LLM:推理模型 (Reasoning) 與 小型語言模型 (SLM)

模型名稱 開發團隊 💡 核心優勢與突破點 🚀 推薦適用場景 & 規格標籤
gpt-oss (120B) 🇺🇸 OpenAI o4-mini 級別的開源震撼彈。OpenAI 重新擁抱開源,提供極強的邏輯推理能力。 複雜程式碼生成、高階數學解題
[頂級推理] [OpenAI]
Llama Nemotron Super v1.5 🇺🇸 NVIDIA (輝達) 三倍吞吐,單卡可跑。49B 的參數兼顧了極高的效能與相對親民的硬體需求。 企業內部知識庫、高併發 API 服務
[NVIDIA特化] [單卡部署]
OpenReasoning-Nemotron 🇺🇸 NVIDIA (輝達) 1.5B 參數秒殺 o3。極小參數卻擁有恐怖的數學運算與邏輯推理能力。 邊緣設備即時運算、專精型任務
[極端輕量] [數學核武]

🧠 邊緣運算首選:Small Language Models (SLM)

模型名稱 開發團隊 💡 核心優勢與突破點 🚀 推薦適用場景 & 規格標籤
Phi-4 🇺🇸 Microsoft 以小博大的教科書。微軟 Phi 家族最新力作,在各項 Benchmark 上經常越級打怪。 本地筆電開發、離線文件摘要
[微軟生態] [高CP值]
Llama 3.2 (1B/3B) 🇺🇸 Meta 專為端側與手機設計。Meta 官方釋出的輕量版本,完美適配行動裝置。 iOS/Android APP 內建 AI、物聯網設備
[Edge AI] [手機可跑]
SmolLM2 🇺🇸/🇪🇺 Hugging Face 專為手機執行的極小模型。極致壓縮體積,適合資源極度受限的環境。 穿戴式裝置、超低功耗設備
[極小體積] [HuggingFace]


LLM

🏛️ Large Language Models (大型語言模型)


Embedding

🔎 Embedding & Reranker


Speech

🔊 Speech-to-Speech LLM (語音大模型)


Vision

👁️ Vision-Language Model (視覺大語言模型)


Multimodal

🌌 Multimodal LLM (多模態大語言模型)

語音助手工具

相關論文

相關連結

RAG

LangChain

LLM 部署開發相關

LLM 模型匯整

Code LLM 代碼大模型介紹

LLM 模型介紹

</details>