Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷,是為了普及與分享深度學習及AI領域的尖端知識,深信AI的價值在於解決真實世界的商業問題。

Deep Learning 101

去 YouTube 訂閱 | Facebook | 回 GitHub Pages 首頁 | 到 GitHub 點星 | 網站 | 到 Hugging Face Space 按愛心


📚 LLM 大語言模型・必讀資源總整理

編者按: 本頁面彙整目前最主流的 LLM 排行榜、開源模型、推論與微調工具,以及相關學術論文。

如果您想尋找更詳細的筆記,歡迎訪問 GitHub Repository: 👉 GitHub: Natural-Language-Processing-Paper (歡迎 Star ⭐)



Tool 名稱 功能範疇 集成能力 適用場景 建議選擇 知識庫技術
Flowise 簡單可視化流程建構 支持 LangChain 和 GPT,多平台部署 快速構建簡單 LLM 流程應用 適合需要快速構建和部署 LLM 應用的用戶  
Langflow 多智能體與 RAG 應用構建 外部工具、API 與資料庫集成 複雜任務鏈與多智能體應用開發 適合構建複雜任務鏈的技術型開發者  
Dify 全面應用開發與管理 多模型支持,全面工作流與模型管理 全生命周期管理與複雜應用開發 適合需要全面管理 LLM 應用的開發者或企業 基於 Pinecone 的向量數據庫、Notion API 同步(增量更新)、支持 Rerank 模型(bge-reranker-base)、提供行業模板庫
n8n 通用自動化與流程編排平台 支持超過 350 種服務與 API 集成,可視化流程編輯 應用整合、自動化工作流程構建、自動回應觸發器 適合需要自動處理非 AI 任務或整合各類 SaaS 工具的用戶與開發者 可與向量資料庫結合使用,但非內建
RAGFlow 模組化 RAG 管線與知識應用框架 支持 LangChain、Chroma、FAISS 等,可用於構建完整 RAG 工作流 知識問答、文件檢索、RAG 多階段優化 適合需要建構可定製、模組化 RAG 系統的開發者 支持多向量資料庫(Chroma、FAISS)、可結合自定義資料源與檢索策略
New API 模型接口統一與分發 OpenAI 格式統一,支持多支付協議與分發管理 多模型接口管理與分發 適合需要統一管理多種 AI 模型接口的用戶  
XORBITS Inference 分散式推理與部署 與 Hugging Face 等模型相容,支援雲端及本地等多種部署環境 大規模模型推理與雲端部署,需快速搭建可擴展的推理服務時 適合需要高效擴展能力、進行大規模模型推理的團隊或企業  
Ollama 本地模型推理與管理 提供命令列介面,支援多種 Llama 模型於本地運行 在有隱私或離線需求的場景下進行本地推理 適合想在本地快速配置 Llama 系列模型的個人或中小型團隊  

✨LLM API Platform Price Comparison

總體戰略比較:三大公有雲 AI 平台 ~ 2025年08月08日

特性 Google Cloud (GCP) Microsoft Azure Amazon Web Services (AWS)
主要 GenAI 平台 Vertex AI Azure OpenAI Service Amazon Bedrock
平台核心理念 AI 技術創新者 企業服務整合者 中立的雲端市集
旗艦/代表性模型 Gemini 系列 (2.5 Pro) OpenAI 模型系列 (GPT-4o) Anthropic Claude 系列
“私有通道”安全技術 VPC Service Controls Private Endpoint Interface VPC Endpoint
計費模式 (安全性) 服務啟用免費 端點按小時計費 + 數據按 GB 計費 端點按小時計費 + 數據按 GB 計費
個人體驗 Gemin無敵+Cloude等模型 只有Open AI 就是少了 Gemini

自行架設 GPU VM 每小時預估費用 ~ 2025年08月08日

GPU 型號 Google Cloud (GCP) Microsoft Azure Amazon Web Services (AWS)
NVIDIA T4 每小時: $0.35
每個月: $255.5
承諾1年:$0.22/$160.60
   
NVIDIA P4 每小時: $0.60
每個月: $438.00
承諾1年:$0.378/$275.94
   
NVIDIA V100 每小時: $2.48
每個月: $1810.40
承諾1年:$1.562/$1140.26
每小時: ~$3.07 每小時: ~$3.06
NVIDIA A100 實例: a2-highgpu-1g (1x A100)
每小時: ~$4.45
實例: Standard_ND96asr_v4 (8x A100)
每小時/每顆: ~$4.21
(整機 ~$33.68/hr)
實例: p4d.24xlarge (8x A100)
每小時/每顆: ~$4.09
(整機 ~$32.77/hr)
NVIDIA H100 實例: a3-highgpu-8g (8x H100)
每小時/每顆: ~$8.37
(整機 ~$66.95/hr)
實例: Standard_ND H100 v5 (8x H100)
每小時/每顆: ~$8.59
(整機 ~$68.75/hr)
實例: p5.48xlarge (8x H100)
每小時/每顆: ~$12.26
(整機 ~$98.08/hr)

大型語言模型API平台價格比較 ~ 2025年08月08日

平台 模型 輸入費用
(USD/1M Tokens)
輸出費用
(USD/1M Tokens)
上下文窗口 多模態能力 定價連結
Google Gemini 2.5 Pro $1.25 (≤200k)
$2.50 (>200k)
$10.00 (≤200k)
$15.00 (>200k)
1M 文/圖/影/音 Vertex AI Pricing
Google Gemini 2.5 Pro Pay-as-you-go Pay-as-you-go 1M 文/圖/影/音 Google AI Studio Pricing
Anthropic Claude Opus 4.1 $15.00 $75.00 200K Anthropic Pricing
Anthropic Claude Sonnet 4 $3.00 $15.00 200k 同上
OpenAI GPT-5/Mini/Nano $1.25/0.25/0.05 $10.0/2.0/0.4 OpenAI Pricing
OpenAI GPT-4.1/Mini/Nano $2/0.4/0.1 $8.0/1.6/0.4 同上
OpenAI GPT-4o $5.00 $15.00 同上
xAI Grok-3 $3.00 $15.00 128K 文字 xAI API
DeepSeek deepseek-chat (V2) $0.14 $0.28 DeepSeek Pricing
阿里 通義千問 Max $0.33 $1.34 131072 文/圖 Qwen Pricing
百度 文心大模型4.5/X1 $0.56/0.26 $2.23/1.11 文/圖 Baidu Pricing

文章目錄


Leaderboards

🏆 排行榜 (Leaderboards)


Fine-tuning

🛠️ 微調技術與資源 (Fine-tuning)

顯存估算 (VRAM)

微調/蒸餾技術教學

微調框架 (Frameworks)

資料集準備 (Datasets)


AI-Agent

🧩 AI Agent 開源框架

完整列表請見:避開 AI 代理 (AI Agents) 與 代理式人工智慧 (Agentic AI) 開發陷阱

核心概念與必讀文章

Agent 框架列表 (按時間排序)


Tools

🛠️ 開發工具 (Tools & Protocols)

MCP (Model Context Protocol)

Browser Automation (瀏覽器自動化)

效率工具 (Efficiency Tools)


AI PTT

🌍 AI PPT (用AI做PPT)


NotebookLM 平替

🌍 NotebookLM 平替


World Models

🌍 World Models (世界模型)


MoE

🧠 MoE (混合專家模型)


SLM

📱 Small Language Models (小型語言模型)


Reasoning

🤔 Reasoning Models (推理模型)


LLM

🏛️ Large Language Models (大型語言模型)


Embedding

🔎 Embedding & Reranker


Speech

🔊 Speech-to-Speech LLM (語音大模型)


Vision

👁️ Vision-Language Model (視覺大語言模型)


Multimodal

🌌 Multimodal LLM (多模態大語言模型)