https://www.twman.org/AI/NLP

https://github.com/Deep-Learning-101/Natural-Language-Processing-Paper

https://huggingface.co/DeepLearning101

https://deep-learning-101.github.io/

手把手帶你一起踩 AI 坑

手把手帶你一起踩 AI 坑https://www.twman.org/AI

LLM

大語言模型 (Large Language Model)

✨LLM API Platform Price Comparison

大型語言模型API平台價格比較

平台 模型 輸入費用 (USD/1M Tokens) 輸出費用 (USD/1M Tokens) 上下文窗口 免費層級 最大速率限制 (RPM / TPM) 多模態能力 特點 / 說明 定價連結
OpenAI OpenAI o1 $15.00 $60.00 200k 不公開 ✅(文字+圖像) Frontier 模型,支援 Vision/Tools/結構化輸出 OpenAI Pricing
OpenAI OpenAI o3-mini $1.10 $4.40 200k 不公開 成本效益模型,適合編碼與數學 同上
Google Gemini 2.5 Pro (Preview) $1.25(≤200k),$2.50(>200k) $10.00(≤200k),$15.00(>200k) >200k ✅(指定模型) 150 RPM / 2M TPM(Tier 1) ✅(文字+圖像) 高階推理力,企業級用途 Gemini API / Gemini 網站
Google Gemini 2.0 Flash $0.10(圖文影),$0.70(音訊) $0.40 1M ✅(15 RPM) 2,000 RPM / 4M TPM ✅(文字+圖+影+音) 多模態支援,企業級速率與穩定性 同上
Google Gemini 2.0 Flash Lite $0.075(全模態) $0.30 1M ✅(30 RPM) 4,000 RPM / 4M TPM ✅(全模態) 超高速率、經濟型多模態模型 同上
DeepSeek deepseek-chat (V3) $0.27 $1.10 64K 不公開 標準價,推理速度佳 DeepSeek Pricing / DeepSeek Chat
DeepSeek deepseek-reasoner (R1) $0.55 $2.19 64K 不公開 高階邏輯推理與數據分析能力 同上
Qwen Qwen-Max $1.60 $6.40 ~32K 不公開 強推理型,偏向高品質產出 Qwen Chat
Qwen Qwen-Plus $0.40 $1.20 ~131K 不公開 均衡型模型,支援較長上下文 同上
Grok grok-3 $3.00 $15.00 131k 不公開 支援思考模式、有限搜尋功能 Grok 官網
百度 文心一言(ERNIE Bot) 不公開(免費使用) 不公開(免費使用) 不公開 不公開 ✅(圖像/語音) 支援中文語境與多模態任務 文心一言

AlpacaEval Leaderboard

Open LLM Leaderboard

Big Code Models Leaderboard

Awesome-Chinese-LLM

人工智慧大語言模型微調技術:SFT 監督微調、LoRA 微調方法、P-tuning v2 微調方法、Freeze 監督微調方法

【LLM】從零開始訓練大模型

大模型所需GPU 記憶體筆記

不同參數規模大語言模型在不同微調方法下所需的顯存總結

Tool 名稱 功能範疇 集成能力 適用場景 建議選擇 知識庫技術
Flowise 簡單可視化流程建構 支持 LangChain 和 GPT,多平台部署 快速構建簡單 LLM 流程應用 適合需要快速構建和部署 LLM 應用的用戶  
Langflow 多智能體與 RAG 應用構建 外部工具、API 與資料庫集成 複雜任務鏈與多智能體應用開發 適合構建複雜任務鏈的技術型開發者  
Dify 全面應用開發與管理 多模型支持,全面工作流與模型管理 全生命周期管理與複雜應用開發 適合需要全面管理 LLM 應用的開發者或企業 基於 Pinecone 的向量數據庫、Notion API 同步(增量更新)、支持 Rerank 模型(bge-reranker-base)、提供行業模板庫
n8n 通用自動化與流程編排平台 支持超過 350 種服務與 API 集成,可視化流程編輯 應用整合、自動化工作流程構建、自動回應觸發器 適合需要自動處理非 AI 任務或整合各類 SaaS 工具的用戶與開發者 可與向量資料庫結合使用,但非內建
RAGFlow 模組化 RAG 管線與知識應用框架 支持 LangChain、Chroma、FAISS 等,可用於構建完整 RAG 工作流 知識問答、文件檢索、RAG 多階段優化 適合需要建構可定製、模組化 RAG 系統的開發者 支持多向量資料庫(Chroma、FAISS)、可結合自定義資料源與檢索策略
New API 模型接口統一與分發 OpenAI 格式統一,支持多支付協議與分發管理 多模型接口管理與分發 適合需要統一管理多種 AI 模型接口的用戶  
XORBITS Inference 分散式推理與部署 與 Hugging Face 等模型相容,支援雲端及本地等多種部署環境 大規模模型推理與雲端部署,需快速搭建可擴展的推理服務時 適合需要高效擴展能力、進行大規模模型推理的團隊或企業  
Ollama 本地模型推理與管理 提供命令列介面,支援多種 Llama 模型於本地運行 在有隱私或離線需求的場景下進行本地推理 適合想在本地快速配置 Llama 系列模型的個人或中小型團隊  
FastGPT 知識庫問答系統與工作流編排 提供開箱即用的數據處理、模型調用,支持可視化工作流編排 快速構建智能問答系統與複雜問答場景 適合需要快速部署知識庫問答系統的用戶 混合索引(Elasticsearch + FAISS)、支援 PDF 表格解析(PyMuPDF 集成)、BM25 權重可調、需人工標註種子數據
Coze AI 智能體開發平台 整合插件、長短期記憶、工作流、卡片等功能,支持多平台發布 低門檻快速搭建個性化或具備商業價值的智能體 適合無需編程即可創建智能體的用戶 自研分佈式索引、電商數據結構

工具

AI Agent 開源框架

Agent 名稱 功能範疇 集成能力 適用場景 建議選擇
AutoGPT 自主 AI 代理構建與運行 使用 OpenAI 的 GPT-4 和 GPT-3.5 大型語言模型,允許為各種個人和商業項目構建代理 適合需要自動化完成多目標複雜任務的用戶 適合希望利用 GPT 模型自動執行任務的開發者
MetaGPT 多智能體協作框架,專注於軟體開發 採用多智能體框架,模擬人類軟體開發團隊,包括產品經理、架構師、項目經理、工程師等角色 適合需要模擬軟體開發流程,提高開發效率和質量的場景 適合希望利用 AI 模擬軟體開發流程的團隊或企業
AgentGPT 基於網頁的自主 AI 代理配置與部署 支持在瀏覽器中配置和部署自主 AI 代理,並讓其完成任何目標 適合需要快速構建和部署自主 AI 代理的用戶 適合希望在瀏覽器中快速配置 AI 代理的開發者
HuggingGPT 多模型協作的 AI 系統 包含一個大型語言模型作為控制器和許多專家模型作為協作執行者 適合需要多模型協作處理複雜任務的場景 適合希望利用多模型協作提高任務處理能力的團隊或企業

語音到語音大模型

混合專家(Mixture of Experts, MoE)模型

小型語言模型

大型語言模型

多模態大語言模型 (Multimodal)

語音助手工具