Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101
AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
由 TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷,是為了普及與分享深度學習及AI領域的尖端知識,深信AI的價值在於解決真實世界的商業問題。
去 YouTube 訂閱 | Facebook | 回 GitHub Pages 首頁 | 到 GitHub 點星 | 網站 | 到 Hugging Face Space 按愛心
📚 LLM 大語言模型・必讀資源總整理
編者按: 本頁面彙整目前最主流的 LLM 排行榜、開源模型、推論與微調工具,以及相關學術論文。
如果您想尋找更詳細的筆記,歡迎訪問 GitHub Repository: 👉 GitHub: Natural-Language-Processing-Paper (歡迎 Star ⭐)
| Tool 名稱 | 功能範疇 | 集成能力 | 適用場景 | 建議選擇 | 知識庫技術 |
|---|---|---|---|---|---|
| Flowise | 簡單可視化流程建構 | 支持 LangChain 和 GPT,多平台部署 | 快速構建簡單 LLM 流程應用 | 適合需要快速構建和部署 LLM 應用的用戶 | |
| Langflow | 多智能體與 RAG 應用構建 | 外部工具、API 與資料庫集成 | 複雜任務鏈與多智能體應用開發 | 適合構建複雜任務鏈的技術型開發者 | |
| Dify | 全面應用開發與管理 | 多模型支持,全面工作流與模型管理 | 全生命周期管理與複雜應用開發 | 適合需要全面管理 LLM 應用的開發者或企業 | 基於 Pinecone 的向量數據庫、Notion API 同步(增量更新)、支持 Rerank 模型(bge-reranker-base)、提供行業模板庫 |
| n8n | 通用自動化與流程編排平台 | 支持超過 350 種服務與 API 集成,可視化流程編輯 | 應用整合、自動化工作流程構建、自動回應觸發器 | 適合需要自動處理非 AI 任務或整合各類 SaaS 工具的用戶與開發者 | 可與向量資料庫結合使用,但非內建 |
| RAGFlow | 模組化 RAG 管線與知識應用框架 | 支持 LangChain、Chroma、FAISS 等,可用於構建完整 RAG 工作流 | 知識問答、文件檢索、RAG 多階段優化 | 適合需要建構可定製、模組化 RAG 系統的開發者 | 支持多向量資料庫(Chroma、FAISS)、可結合自定義資料源與檢索策略 |
| New API | 模型接口統一與分發 | OpenAI 格式統一,支持多支付協議與分發管理 | 多模型接口管理與分發 | 適合需要統一管理多種 AI 模型接口的用戶 | |
| XORBITS Inference | 分散式推理與部署 | 與 Hugging Face 等模型相容,支援雲端及本地等多種部署環境 | 大規模模型推理與雲端部署,需快速搭建可擴展的推理服務時 | 適合需要高效擴展能力、進行大規模模型推理的團隊或企業 | |
| Ollama | 本地模型推理與管理 | 提供命令列介面,支援多種 Llama 模型於本地運行 | 在有隱私或離線需求的場景下進行本地推理 | 適合想在本地快速配置 Llama 系列模型的個人或中小型團隊 |
✨LLM API Platform Price Comparison
總體戰略比較:三大公有雲 AI 平台 ~ 2025年08月08日
| 特性 | Google Cloud (GCP) | Microsoft Azure | Amazon Web Services (AWS) |
|---|---|---|---|
| 主要 GenAI 平台 | Vertex AI | Azure OpenAI Service | Amazon Bedrock |
| 平台核心理念 | AI 技術創新者 | 企業服務整合者 | 中立的雲端市集 |
| 旗艦/代表性模型 | Gemini 系列 (2.5 Pro) | OpenAI 模型系列 (GPT-4o) | Anthropic Claude 系列 |
| “私有通道”安全技術 | VPC Service Controls | Private Endpoint | Interface VPC Endpoint |
| 計費模式 (安全性) | 服務啟用免費 | 端點按小時計費 + 數據按 GB 計費 | 端點按小時計費 + 數據按 GB 計費 |
| 個人體驗 | Gemin無敵+Cloude等模型 | 只有Open AI | 就是少了 Gemini |
自行架設 GPU VM 每小時預估費用 ~ 2025年08月08日
- 台灣計價: (美元費用 x 當期匯率) + 5% 營業稅
- 基準: 以下價格均以美國東部 (US East) 或美國中部 (US Central) 的主要資料中心為基準,這是行業內最常用於比較定價的區域。
- 定價模式: 均採用 「按需 (On-Demand)」 定價,不包含任何預留或長期承諾折扣。
- 幣別: 均為美元 (USD, $)。
| GPU 型號 | Google Cloud (GCP) | Microsoft Azure | Amazon Web Services (AWS) |
|---|---|---|---|
| NVIDIA T4 | 每小時: $0.35 每個月: $255.5 承諾1年:$0.22/$160.60 |
||
| NVIDIA P4 | 每小時: $0.60 每個月: $438.00 承諾1年:$0.378/$275.94 |
||
| NVIDIA V100 | 每小時: $2.48 每個月: $1810.40 承諾1年:$1.562/$1140.26 |
每小時: ~$3.07 | 每小時: ~$3.06 |
| NVIDIA A100 | 實例: a2-highgpu-1g (1x A100)每小時: ~$4.45 |
實例: Standard_ND96asr_v4 (8x A100)每小時/每顆: ~$4.21 (整機 ~$33.68/hr) |
實例: p4d.24xlarge (8x A100)每小時/每顆: ~$4.09 (整機 ~$32.77/hr) |
| NVIDIA H100 | 實例: a3-highgpu-8g (8x H100)每小時/每顆: ~$8.37 (整機 ~$66.95/hr) |
實例: Standard_ND H100 v5 (8x H100)每小時/每顆: ~$8.59 (整機 ~$68.75/hr) |
實例: p5.48xlarge (8x H100)每小時/每顆: ~$12.26 (整機 ~$98.08/hr) |
大型語言模型API平台價格比較 ~ 2025年08月08日
| 平台 | 模型 | 輸入費用 (USD/1M Tokens) |
輸出費用 (USD/1M Tokens) |
上下文窗口 | 多模態能力 | 定價連結 |
|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 (≤200k) $2.50 (>200k) |
$10.00 (≤200k) $15.00 (>200k) |
1M | 文/圖/影/音 | Vertex AI Pricing | |
| Gemini 2.5 Pro | Pay-as-you-go | Pay-as-you-go | 1M | 文/圖/影/音 | Google AI Studio Pricing | |
| Anthropic | Claude Opus 4.1 | $15.00 | $75.00 | 200K | ❓ | Anthropic Pricing |
| Anthropic | Claude Sonnet 4 | $3.00 | $15.00 | 200k | ❓ | 同上 |
| OpenAI | GPT-5/Mini/Nano | $1.25/0.25/0.05 | $10.0/2.0/0.4 | ❓ | ❓ | OpenAI Pricing |
| OpenAI | GPT-4.1/Mini/Nano | $2/0.4/0.1 | $8.0/1.6/0.4 | ❓ | ❓ | 同上 |
| OpenAI | GPT-4o | $5.00 | $15.00 | ❓ | ❓ | 同上 |
| xAI | Grok-3 | $3.00 | $15.00 | 128K | 文字 | xAI API |
| DeepSeek | deepseek-chat (V2) | $0.14 | $0.28 | ❓ | ❌ | DeepSeek Pricing |
| 阿里 | 通義千問 Max | $0.33 | $1.34 | 131072 | 文/圖 | Qwen Pricing |
| 百度 | 文心大模型4.5/X1 | $0.56/0.26 | $2.23/1.11 | ❓ | 文/圖 | Baidu Pricing |
文章目錄
- 🏆 排行榜 (Leaderboards)
- 🛠️ 微調技術與資源 (Fine-tuning)
- 🧩 AI Agent 開源框架
- 🛠️ 開發工具 (Tools & Protocols)
- 🌍 World Models (世界模型)
- 🧠 MoE (混合專家模型)
- 📱 Small Language Models (小型語言模型)
- 🤔 Reasoning Models (推理模型)
- 🏛️ Large Language Models (大型語言模型)
- 🔎 Embedding & Reranker
- 🔊 Speech-to-Speech LLM (語音大模型)
- 👁️ Vision-Language Model (視覺大語言模型)
- 🌌 Multimodal LLM (多模態大語言模型)
Leaderboards
🏆 排行榜 (Leaderboards)
Fine-tuning
🛠️ 微調技術與資源 (Fine-tuning)
顯存估算 (VRAM)
- 大模型所需 GPU 記憶體筆記
- 資源:📝 微信公眾號
- 不同參數規模在微調方法下所需的顯存總結
微調/蒸餾技術教學
- 微調技術全解
- 說明:SFT、LoRA、P-tuning v2、Freeze 監督微調方法
- 資源:📝 知乎專欄
- LoRA vs 完全微調
- 說明:MIT 21頁論文講懂了
- 資源:📝 機器之心
- 大模型微調 (Fine-tuning) 全解
- 資源:📝 53AI
- Unsloth 官方微調技巧
- 說明:初學者必看指南
- 資源:📝 微信公眾號
- 零代碼一站式微調
- 說明:從資料集準備到模型微調全流程
- 資源:📝 知乎專欄
- DeepSeek-R1 微調指南
- 說明:微調為領域專家
- 資源:📝 知乎專欄
- EasyDistill
- 說明:知識蒸餾不再難!阿里開源EasyDistill及DistilQwen模型家族,開源即用、效能強勁!
-
資源:🐙 GitHub 📄 AlphaXiv
- NVIDIA NeMo
- 說明:模型剪枝和知識蒸餾
- 資源:📝 NVIDIA Blog
微調框架 (Frameworks)
- LLaMA Factory
- Torchtune
-
資源:🐙 GitHub 📖 官方文件 - 延伸:📝 Llama3.1 知識蒸餾實戰
-
資料集準備 (Datasets)
- 微調資料集實戰
- Easy Dataset
- 說明:大模型微調資料集生產工具
- 資源:📝 知乎專欄
- OpenDeepWiki
- 說明:根據現有檔案產生微調資料集
- 資源:📝 知乎專欄
- COIG-CQIA
- 說明:零一萬物發布高品質中文指令微調數據
- 資源:📝 知乎專欄
AI-Agent
🧩 AI Agent 開源框架
核心概念與必讀文章
- AI Search Has A Citation Problem
- 資源:📝 CJR
- Agentic AI vs AI Agents
- 說明:A Conceptual Taxonomy, Applications and Challenges
- 資源:📄 AlphaXiv
- OWASP Agentic AI
- 說明:Threats and Mitigations
- 資源:🛡️ OWASP
- Agent 工作流入門
- FinRobot
-
資源:📄 AlphaXiv 📚 DeepWiki (支援 Gemini 2.5)
-
- Jupyter-AI
- 資源:📚 DeepWiki (支援 Gemini 2.5)
Agent 框架列表 (按時間排序)
-
2026-01-20 OpenClaw(MoltBot/Clawdbot) -
說明:一個跑在你自己電腦上的 AI 助手平台。 👉 點此看深度技術分析 -
資源: 🌐 官網 🐙 GitHub 📝 官方文件 [📝 DeepWiki [📝 Zread 📝 公眾號解讀 📝 公眾號解讀 📝 公眾號解讀 📝 知乎解讀
-
- 2025-11-15|Agno
- 2025-10-28|Tongyi DeepResearch
- 說明:通義全面開源,超越 OpenAI 閉源框架
-
資源:📝 DeepResearch 📝 中文解讀
- 2025-10-28|DeepAgent
- 說明:首個全自主深度推理智能體
-
資源:📝 RUC-NLPIR 📝 中文解讀
- 2025-10-19|Gemini Computer Use
- 說明:Google 推出讓 AI 代理操作網頁介面
-
資源:📖 官方文件 📝 iThome 報導 🐙 GitHub
- 2025-10-10|SurfSense
- 說明:GitHub 萬星王炸,整合 Slack/Notion/Jira
-
資源:📝 MODSetter 📝 中文解讀
- 2025-08-29|Microsoft Agent Framework
- 2025-08-29|MiroThinker
- 2025-07-03|multi-modal-researcher
- 資源:🐙 GitHub
- 2025-06-25|Gemini CLI
- 說明:你的開源 AI 代理
-
資源:🐙 GitHub 📝 Google Blog
- 2025-06-06|PandaWiki
- 2025-06-03|Gemini Fullstack LangGraph
- 說明:開源版 Perplexity
-
資源:📚 DeepWiki 🌐 DEMO 📝 53AI 報導
- 2025-06-03|Perplexica
- 2025-06-02|Paper2Poster
- 2025-06-01|Agent Zero
- 2025-05-30|WebDancer
- 說明:Alibaba 開源 WebAgent
-
資源:📄 AlphaXiv 📚 DeepWiki
- 2025-05-28|Lemon AI
- 2025-05-25|OpenHands
- 2025-05-18|Agent-Squad
- 說明:輕量級開源 AI 多智能體框架 (AWS Labs)
-
資源:📚 DeepWiki 📝 中文解讀
- 2025-05-10|FlowGram (ByteDance)
- 說明:字節跳動開源 Coze 核心工作流引擎
-
資源:🐙 GitHub 📝 公眾號解讀 📚 DeepWiki
- 2025-05-10|DeerFlow
- 說明:字節跳動 DeerFlow 解析
-
資源:🐙 GitHub 📝 深度解析 📚 DeepWiki
- 2025-05-09|OpenDeepWiki
- 2025-05-07|AI Manus
- 資源:📚 DeepWiki
- 2025-04-24|suna
- 2025-04-22|釦子空間 (Coze Space)
- 2025-04-03|AutoAgent
- 2025-04-03|Agent Development Kit (ADK)
- 2025-04-03|Deepsite
- 2025-03-30|DeepGemini
- 2025-03-24|AgenticSeek
- 2025-03-20|DeepSearcher
- 說明:私有資料 + Deepseek 打造本地 Deep Research
-
資源:📝 DeepSearcher 📝 知乎解讀
- 2025-03-11|autoMate
- 2025-03-10|OpenManus
- 2025-02-28|MoneyPrinterTurbo
- 2024-02-01|MobileAgent
- 2025-01-03|smolagents
- 2024-10-26|OmniParser
- 2024-09-23|STORM
Tools
🛠️ 開發工具 (Tools & Protocols)
MCP (Model Context Protocol)
- 2025-08-20|FastAPI-MCP
- 2025-04-15|automcp
- 2025-04-10|line-bot-mcp-server
- 資源:🐙 GitHub
- 2025-04-05|GitMCP
- 2025-03-14|playwright-mcp
Browser Automation (瀏覽器自動化)
- Browser-use
- 資源:🐙 GitHub
- 2025-06-04:workflow-use (一次錄製,永久使用)
-
2025-04-16:web-ui 📚 如何使用 - 2025-03-28:browser-use-webui
- 2025-02-16:webui 部署教學
- 2025-01-23:讓 AI 像人類一樣使用瀏覽器
效率工具 (Efficiency Tools)
- 2025-12-20|NVIDIA Nemotron-3-Nano
- 2025-11-20|LinearRAG
- 2025-09-11|DeepMCPAgent
- 2025-07-30|LangExtract
- 說明:Gemini 驅動的資訊擷取庫
-
資源:🐙 GitHub 📝 Google Developers
- 2025-06-28|docext
- 2025-06-10|Agentic-Doc
- 2025-06-06|daily-arXiv-ai-enhanced
- 說明:每日爬取 arXiv 並用 LLM 產生中文摘要
- 資源:🐙 GitHub
- 2025-05-22|AingDesk
- 說明:零門檻本地 AI 部署
-
資源:📚 DeepWiki 📝 知乎解讀
- 2025-05-20|news-agents
- 資源:📚 DeepWiki
- 2025-05-16|Follow
- 說明:資訊聚合神器
-
資源:📚 DeepWiki 📝 知乎推薦
- 2025-05-11|SurfSense
- 2025-04-28|PaperCoder (Paper2Code)
- 說明:Automating Code Generation from Scientific Papers
-
資源:📚 DeepWiki 📄 AlphaXiv
- 2025-04-16|OneFileLLM
- 2025-04-16|ScrapeGraphAI
- 2025-04-15|stagehand
- 2025-04-11|nanobrowser
- 2025-04-10|DevDocs
- 2025-04-06|sqlchat
- 2025-03-26|pdf-craft
- 2025-03-25|OCRmyPDF
- 2025-03-12|AingDesk (同上)
-
資源:📚 DeepWiki 📝 知乎解讀
-
- 2025-03-08|composio
- 2025-02-25|PySpur
- 2025-01-13|DocAligner
- 2025-01-07|activepieces
- 2024-12-19|LightRAG
- 2024-12-15|markitdown
- 資源:🐙 GitHub
AI PTT
🌍 AI PPT (用AI做PPT)
-
2026-01-04 LangChat Slides -
2025-12-13 banana-slides - 2025-07-26|presenton
- 2025-07-03|MultiAgentPPT
NotebookLM 平替
🌍 NotebookLM 平替
-
2026-01-04 Notex - 說明:一個開源 NotebookLM 替代方案的實現
-
2025-12-06 Open NoteBook - 說明:一個開源的、注重隱私的Google Notebook LM 替代方案
-
2025-12-06 Auto-Slides - 說明:不只是幫你寫,還能幫你講。它讓論文第一次有機會“開口說話”
World Models
🌍 World Models (世界模型)
- 2025-09-25|Code World Model
- 說明:Yann LeCun 攜 320 億參數開源世界模型
-
資源:📝 Meta Research 📝 新浪報導
MoE
🧠 MoE (混合專家模型)
- 2024-12-13|DeepSeek-VL2
- 騰訊混元 (Hunyuan-Large)
SLM
📱 Small Language Models (小型語言模型)
- 2025-01-07|Smolagents
- 2024-12-13|Phi-4
- 說明:微軟 Phi-4 正式發表,以小博大
-
資源:🤗 HuggingFace 📝 公眾號
- 2024-11-18|MobileLLM-1.5B
- 說明:Meta 打造行動裝置超強語言模型
-
資源:🤗 HuggingFace 📝 公眾號
- 2024-11-04|SmolLM2
- 說明:手機執行的小型語言模型
-
資源:🤗 HuggingFace 📝 iThome
- 2024-09-25|Llama 3.2
- 說明:1B/3B 端側模型 (Edge AI)
- 資源:📝 Meta Blog
Reasoning
🤔 Reasoning Models (推理模型)
- 2025-08-05|gpt-oss
- 說明:OpenAI 重新開源,o4-mini 水平
-
資源:🤗 HuggingFace 📝 OpenAI Blog 📝 機器之心
- 2025-07-29|Llama Nemotron Super v1.5
- 說明:英偉達開源,三倍吞吐、單卡可跑
-
資源:🤗 HuggingFace 📝 知乎解讀
- 2025-07-27|OpenReasoning-Nemotron
- 說明:英偉達數學核武,1.5B 參數秒殺 o3
-
資源:🤗 HuggingFace 📝 公眾號解讀
- 2025-05-06|Llama-Nemotron
- 說明:英偉達高效推理系列
-
資源:📄 AlphaXiv 📚 DeepWiki 📝 知乎解讀
- 2025-04-16|Video-R1
- 說明:Reinforcing Video Reasoning in MLLMs
-
資源:📄 AlphaXiv 🐙 GitHub 📝 36Kr 報導
LLM
🏛️ Large Language Models (大型語言模型)
- 2025-08-05|Claude Opus 4.1
- 資源:📝 機器之心
- 2024-11-23|Ai2 Tülu 3
- 說明:真・開源模型,公開「後訓練」一切
-
資源:🐙 GitHub 🌐 Playground 🤗 Model 📝 機器之心
- 2024-11-09|Ai2 OpenScholar
- 2024-09-25|Llama 3.2 90b/11b
- 資源:📝 Meta Blog
Embedding
🔎 Embedding & Reranker
- 2025-07-14|Gemini Embedding 001
- 2025-06-05|Qwen3 Embedding
- 說明:新一代文本表徵與排序模型
-
資源:📝 Qwen Blog 🤗 Embedding 🤗 Reranker
Speech
🔊 Speech-to-Speech LLM (語音大模型)
- TEN Agent
- pipecat
-
2026-01-15 PersonaPlex-7B-V1 -
說明:重塑實時語音交互的 “全雙工” 黑科技 👉 點此看深度技術分析 -
資源:🤗 HuggingFace 🐙 GitHub 🌐 Project 論文 📝 公眾號解讀
-
- 2025-12-24|Fun-Audio-Chat-8B
- 2025-11-03|LongCat-Flash-Omni
- 說明:開啟全模態即時互動時代
-
資源:🤗 HuggingFace 📝 知乎解讀
-
2025-09-19 Xiaomi-MiMo-Audio - 說明:小米開源首個原生端對端語音大模式
-
資源:🤗 HuggingFace 📝 知乎解讀
- 2025-07-21|Audio Flamingo 3
- 2025-05-08|Voila
- HuggingFace Speech-to-Speech
- 資源:🐙 GitHub
Vision
👁️ Vision-Language Model (視覺大語言模型)
- 2025-05-20|Seed1.5-VL
- 說明:具有視覺增強多模態能力的高階語言模型
-
資源:🐙 GitHub 📄 AlphaXiv 📝 知乎解讀
- 2025-05-12|nanoVLM
- 資源:📚 DeepWiki
Multimodal
🌌 Multimodal LLM (多模態大語言模型)
- InternVL
- 說明:刷新開源多模態大模型效能新紀錄
-
資源:🐙 GitHub 📄 AlphaXiv 📚 DeepWiki 📝 知乎解讀
- 2025-05-24|Dolphin
- 說明:開源多模態複雜文件解析模型
-
資源:📄 AlphaXiv 📚 DeepWiki 📝 知乎解讀
- 2025-05-21|Gemma 3n
- 2025-03-18|Mistral Small 3.1
- 說明:128K 上下文,效能碾壓 GPT-4o Mini
-
資源:🤗 HuggingFace 📝 知乎解讀
- 2025-03-14|Vision-R1
- 2025-02-28|HumanOmni
- Phi Family (Microsoft)
-
資源:🤗 Collection 🤗 Phi-4 Multimodal -
2025-02-27:📝 56億參數秒殺 GPT-4o 📝 小身材大智慧 - 2024-09-12:📝 Phi 3.5 mini 發布
-
- MiniCPM
- 資源:🐙 GitHub
-
2025-01-16:📝 MiniCPM-o 2.6 發布 📖 文檔 - 2024-09-11:📝 升級 Ollama 支援
-
2024-09-06:📝 MiniCPM 3.0 開源 🐙 GitHub -
2024-09-05:📝 魔改 MiniCPM-V 🐙 GitHub