Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。

Deep Learning 101 Buy Me A Coffee

去 YouTube 訂閱 | Facebook | 回 GitHub Pages | 到 GitHub 點星 | 網站 | 到 Hugging Face Space 按愛心


大語言模型 語音處理 自然語言處理 電腦視覺
Large Language Model Speech Processing Natural Language Processing, NLP Computer Vision

用 AI 懂 AI

AI 技術 體驗/分享

手把手帶你一起踩 AI 坑https://www.twman.org/AI


AI 技術 開源/試用

LLM

大語言模型 (Large Language Model)

✨LLM API Platform Price Comparison

大型語言模型API平台價格比較 ~2025/04

平台 模型 輸入費用 (USD/1M Tokens) 輸出費用 (USD/1M Tokens) 上下文窗口 免費層級 最大速率限制 (RPM / TPM) 多模態能力 特點 / 說明 定價連結
OpenAI OpenAI o1 $15.00 $60.00 200k 不公開 ✅(文字+圖像) Frontier 模型,支援 Vision/Tools/結構化輸出 OpenAI Pricing
OpenAI OpenAI o3-mini $1.10 $4.40 200k 不公開 成本效益模型,適合編碼與數學 同上
Google Gemini 2.5 Pro (Preview) $1.25(≤200k),$2.50(>200k) $10.00(≤200k),$15.00(>200k) >200k ✅(指定模型) 150 RPM / 2M TPM(Tier 1) ✅(文字+圖像) 高階推理力,企業級用途 Gemini API / Gemini 網站
Google Gemini 2.0 Flash $0.10(圖文影),$0.70(音訊) $0.40 1M ✅(15 RPM) 2,000 RPM / 4M TPM ✅(文字+圖+影+音) 多模態支援,企業級速率與穩定性 同上
Google Gemini 2.0 Flash Lite $0.075(全模態) $0.30 1M ✅(30 RPM) 4,000 RPM / 4M TPM ✅(全模態) 超高速率、經濟型多模態模型 同上
DeepSeek deepseek-chat (V3) $0.27 $1.10 64K 不公開 標準價,推理速度佳 DeepSeek Pricing / DeepSeek Chat
DeepSeek deepseek-reasoner (R1) $0.55 $2.19 64K 不公開 高階邏輯推理與數據分析能力 同上
Qwen Qwen-Max $1.60 $6.40 ~32K 不公開 強推理型,偏向高品質產出 Qwen Chat
Qwen Qwen-Plus $0.40 $1.20 ~131K 不公開 均衡型模型,支援較長上下文 同上
Grok grok-3 $3.00 $15.00 131k 不公開 支援思考模式、有限搜尋功能 Grok 官網
百度 文心一言(ERNIE Bot) 不公開(免費使用) 不公開(免費使用) 不公開 不公開 ✅(圖像/語音) 支援中文語境與多模態任務 文心一言







Tool 名稱 功能範疇 集成能力 適用場景 建議選擇 知識庫技術
Flowise 簡單可視化流程建構 支持 LangChain 和 GPT,多平台部署 快速構建簡單 LLM 流程應用 適合需要快速構建和部署 LLM 應用的用戶  
Langflow 多智能體與 RAG 應用構建 外部工具、API 與資料庫集成 複雜任務鏈與多智能體應用開發 適合構建複雜任務鏈的技術型開發者  
Dify 全面應用開發與管理 多模型支持,全面工作流與模型管理 全生命周期管理與複雜應用開發 適合需要全面管理 LLM 應用的開發者或企業 基於 Pinecone 的向量數據庫、Notion API 同步(增量更新)、支持 Rerank 模型(bge-reranker-base)、提供行業模板庫
n8n 通用自動化與流程編排平台 支持超過 350 種服務與 API 集成,可視化流程編輯 應用整合、自動化工作流程構建、自動回應觸發器 適合需要自動處理非 AI 任務或整合各類 SaaS 工具的用戶與開發者 可與向量資料庫結合使用,但非內建
RAGFlow 模組化 RAG 管線與知識應用框架 支持 LangChain、Chroma、FAISS 等,可用於構建完整 RAG 工作流 知識問答、文件檢索、RAG 多階段優化 適合需要建構可定製、模組化 RAG 系統的開發者 支持多向量資料庫(Chroma、FAISS)、可結合自定義資料源與檢索策略
New API 模型接口統一與分發 OpenAI 格式統一,支持多支付協議與分發管理 多模型接口管理與分發 適合需要統一管理多種 AI 模型接口的用戶  
XORBITS Inference 分散式推理與部署 與 Hugging Face 等模型相容,支援雲端及本地等多種部署環境 大規模模型推理與雲端部署,需快速搭建可擴展的推理服務時 適合需要高效擴展能力、進行大規模模型推理的團隊或企業  
Ollama 本地模型推理與管理 提供命令列介面,支援多種 Llama 模型於本地運行 在有隱私或離線需求的場景下進行本地推理 適合想在本地快速配置 Llama 系列模型的個人或中小型團隊  
FastGPT 知識庫問答系統與工作流編排 提供開箱即用的數據處理、模型調用,支持可視化工作流編排 快速構建智能問答系統與複雜問答場景 適合需要快速部署知識庫問答系統的用戶 混合索引(Elasticsearch + FAISS)、支援 PDF 表格解析(PyMuPDF 集成)、BM25 權重可調、需人工標註種子數據
Coze AI 智能體開發平台 整合插件、長短期記憶、工作流、卡片等功能,支持多平台發布 低門檻快速搭建個性化或具備商業價值的智能體 適合無需編程即可創建智能體的用戶 自研分佈式索引、電商數據結構

工具


AI Agent 開源框架


混合專家(Mixture of Experts, MoE)模型

小型語言模型

推理模型

大型語言模型

語音到語音大模型及工具套件

視覺大語言模型 (Vision-Language model)

多模態大語言模型 (Multimodal)

語音助手工具