Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程，花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗；如欲移除資訊還請告知。
由 TonTon Huang Ph.D. 發起，及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷，是為了普及與分享深度學習及AI領域的尖端知識，深信AI的價值在於解決真實世界的商業問題。

📚 LLM 大語言模型・必讀資源總整理

編者按： 本頁面彙整目前最主流的 LLM 排行榜、開源模型、推論與微調工具，以及相關學術論文。

如果您想尋找更詳細的筆記，歡迎訪問 GitHub Repository： 👉 GitHub: Natural-Language-Processing-Paper (歡迎 Star ⭐)

Tool 名稱	功能範疇	集成能力	適用場景	建議選擇	知識庫技術
Flowise	簡單可視化流程建構	支持 LangChain 和 GPT，多平台部署	快速構建簡單 LLM 流程應用	適合需要快速構建和部署 LLM 應用的用戶
Langflow	多智能體與 RAG 應用構建	外部工具、API 與資料庫集成	複雜任務鏈與多智能體應用開發	適合構建複雜任務鏈的技術型開發者
Dify	全面應用開發與管理	多模型支持，全面工作流與模型管理	全生命周期管理與複雜應用開發	適合需要全面管理 LLM 應用的開發者或企業	基於 Pinecone 的向量數據庫、Notion API 同步（增量更新）、支持 Rerank 模型（bge-reranker-base）、提供行業模板庫
n8n	通用自動化與流程編排平台	支持超過 350 種服務與 API 集成，可視化流程編輯	應用整合、自動化工作流程構建、自動回應觸發器	適合需要自動處理非 AI 任務或整合各類 SaaS 工具的用戶與開發者	可與向量資料庫結合使用，但非內建
RAGFlow	模組化 RAG 管線與知識應用框架	支持 LangChain、Chroma、FAISS 等，可用於構建完整 RAG 工作流	知識問答、文件檢索、RAG 多階段優化	適合需要建構可定製、模組化 RAG 系統的開發者	支持多向量資料庫（Chroma、FAISS）、可結合自定義資料源與檢索策略
New API	模型接口統一與分發	OpenAI 格式統一，支持多支付協議與分發管理	多模型接口管理與分發	適合需要統一管理多種 AI 模型接口的用戶
XORBITS Inference	分散式推理與部署	與 Hugging Face 等模型相容，支援雲端及本地等多種部署環境	大規模模型推理與雲端部署，需快速搭建可擴展的推理服務時	適合需要高效擴展能力、進行大規模模型推理的團隊或企業
Ollama	本地模型推理與管理	提供命令列介面，支援多種 Llama 模型於本地運行	在有隱私或離線需求的場景下進行本地推理	適合想在本地快速配置 Llama 系列模型的個人或中小型團隊

✨LLM API Platform Price Comparison

總體戰略比較：三大公有雲 AI 平台 ~ 2025年08月08日

特性	Google Cloud (GCP)	Microsoft Azure	Amazon Web Services (AWS)
主要 GenAI 平台	Vertex AI	Azure OpenAI Service	Amazon Bedrock
平台核心理念	AI 技術創新者	企業服務整合者	中立的雲端市集
旗艦/代表性模型	Gemini 系列 (2.5 Pro)	OpenAI 模型系列 (GPT-4o)	Anthropic Claude 系列
“私有通道”安全技術	VPC Service Controls	Private Endpoint	Interface VPC Endpoint
計費模式 (安全性)	服務啟用免費	端點按小時計費 + 數據按 GB 計費	端點按小時計費 + 數據按 GB 計費
個人體驗	Gemin無敵+Cloude等模型	只有Open AI	就是少了 Gemini

自行架設 GPU VM 每小時預估費用 ~ 2025年08月08日

台灣計價： (美元費用 x 當期匯率) + 5% 營業稅
基準： 以下價格均以美國東部 (US East) 或美國中部 (US Central) 的主要資料中心為基準，這是行業內最常用於比較定價的區域。
定價模式： 均採用 「按需 (On-Demand)」 定價，不包含任何預留或長期承諾折扣。
幣別： 均為美元 (USD, $)。

GPU 型號	Google Cloud (GCP)	Microsoft Azure	Amazon Web Services (AWS)
NVIDIA T4	每小時: $0.35 每個月: $255.5 承諾1年:$0.22/$160.60
NVIDIA P4	每小時: $0.60 每個月: $438.00 承諾1年:$0.378/$275.94
NVIDIA V100	每小時: $2.48 每個月: $1810.40 承諾1年:$1.562/$1140.26	每小時: ~$3.07	每小時: ~$3.06
NVIDIA A100	實例: `a2-highgpu-1g` (1x A100) 每小時: ~$4.45	實例: `Standard_ND96asr_v4` (8x A100) 每小時/每顆: ~$4.21 (整機 ~$33.68/hr)	實例: `p4d.24xlarge` (8x A100) 每小時/每顆: ~$4.09 (整機 ~$32.77/hr)
NVIDIA H100	實例: `a3-highgpu-8g` (8x H100) 每小時/每顆: ~$8.37 (整機 ~$66.95/hr)	實例: `Standard_ND H100 v5` (8x H100) 每小時/每顆: ~$8.59 (整機 ~$68.75/hr)	實例: `p5.48xlarge` (8x H100) 每小時/每顆: ~$12.26 (整機 ~$98.08/hr)

大型語言模型API平台價格比較 ~ 2025年08月08日

平台	模型	輸入費用 (USD/1M Tokens)	輸出費用 (USD/1M Tokens)	上下文窗口	多模態能力	定價連結
Google	Gemini 2.5 Pro	$1.25 (≤200k) $2.50 (>200k)	$10.00 (≤200k) $15.00 (>200k)	1M	文/圖/影/音	Vertex AI Pricing
Google	Gemini 2.5 Pro	Pay-as-you-go	Pay-as-you-go	1M	文/圖/影/音	Google AI Studio Pricing
Anthropic	Claude Opus 4.1	$15.00	$75.00	200K	❓	Anthropic Pricing
Anthropic	Claude Sonnet 4	$3.00	$15.00	200k	❓	同上
OpenAI	GPT-5/Mini/Nano	$1.25/0.25/0.05	$10.0/2.0/0.4	❓	❓	OpenAI Pricing
OpenAI	GPT-4.1/Mini/Nano	$2/0.4/0.1	$8.0/1.6/0.4	❓	❓	同上
OpenAI	GPT-4o	$5.00	$15.00	❓	❓	同上
xAI	Grok-3	$3.00	$15.00	128K	文字	xAI API
DeepSeek	deepseek-chat (V2)	$0.14	$0.28	❓	❌	DeepSeek Pricing
阿里	通義千問 Max	$0.33	$1.34	131072	文/圖	Qwen Pricing
百度	文心大模型4.5/X1	$0.56/0.26	$2.23/1.11	❓	文/圖	Baidu Pricing

Leaderboards

🏆 排行榜 (Leaderboards)

Fine-tuning

🛠️ 微調技術與資源 (Fine-tuning)

顯存估算 (VRAM)

大模型所需 GPU 記憶體筆記
- 資源：📝 微信公眾號
不同參數規模在微調方法下所需的顯存總結
- 資源：📝 DataLearner

微調/蒸餾技術教學

微調技術全解
- 說明：SFT、LoRA、P-tuning v2、Freeze 監督微調方法
- 資源：📝 知乎專欄
LoRA vs 完全微調
- 說明：MIT 21頁論文講懂了
- 資源：📝 機器之心
大模型微調 (Fine-tuning) 全解
- 資源：📝 53AI
Unsloth 官方微調技巧
- 說明：初學者必看指南
- 資源：📝 微信公眾號
零代碼一站式微調
- 說明：從資料集準備到模型微調全流程
- 資源：📝 知乎專欄
DeepSeek-R1 微調指南
- 說明：微調為領域專家
- 資源：📝 知乎專欄
EasyDistill
- 說明：知識蒸餾不再難！阿里開源EasyDistill及DistilQwen模型家族，開源即用、效能強勁！
- 資源：🐙 GitHub 📄 AlphaXiv
NVIDIA NeMo
- 說明：模型剪枝和知識蒸餾
- 資源：📝 NVIDIA Blog

微調框架 (Frameworks)

LLaMA Factory
- 資源：🐙 GitHub 🤗 Demo
- 延伸：📝 中文文檔 📝 架構解析 (2024-09-13) 📝 單卡訓練 Agent 實戰
Torchtune
- 資源：🐙 GitHub 📖 官方文件
- 延伸：📝 Llama3.1 知識蒸餾實戰

資料集準備 (Datasets)

微調資料集實戰
- 資源：📝 資料集怎麼搞？ 📝 LLaMA Factory 資料集建立
Easy Dataset
- 說明：大模型微調資料集生產工具
- 資源：📝 知乎專欄
OpenDeepWiki
- 說明：根據現有檔案產生微調資料集
- 資源：📝 知乎專欄
COIG-CQIA
- 說明：零一萬物發布高品質中文指令微調數據
- 資源：📝 知乎專欄

AI-Agent

🧩 AI Agent 開源框架

完整列表請見：避開 AI 代理 (AI Agents) 與代理式人工智慧 (Agentic AI) 開發陷阱

核心概念與必讀文章

AI Search Has A Citation Problem
- 資源：📝 CJR
Agentic AI vs AI Agents
- 說明：A Conceptual Taxonomy, Applications and Challenges
- 資源：📄 AlphaXiv
OWASP Agentic AI
- 說明：Threats and Mitigations
- 資源：🛡️ OWASP

Agent 工作流入門

資源：📝 從 Agent 到 Workflow

📝 萬字長文綜觀 Agent

📝 什麼是 Agentic 工作流程？

📝 Agentic AI 區別

FinRobot
- 資源：📄 AlphaXiv 📚 DeepWiki (支援 Gemini 2.5)
Jupyter-AI
- 資源：📚 DeepWiki (支援 Gemini 2.5)

Agent 框架列表 (按時間排序)

2026-01-20

OpenClaw(MoltBot/Clawdbot)

說明：一個跑在你自己電腦上的 AI 助手平台。 👉 點此看深度技術分析

資源： 🌐 官網

2025-11-15｜Agno
- 說明：高效能 Multi-agent 系統框架
- 資源：🌐 官網 📝 架構深度解析
2025-10-28｜Tongyi DeepResearch
- 說明：通義全面開源，超越 OpenAI 閉源框架
- 資源：📝 DeepResearch 📝 中文解讀
2025-10-28｜DeepAgent
- 說明：首個全自主深度推理智能體
- 資源：📝 RUC-NLPIR 📝 中文解讀
2025-10-19｜Gemini Computer Use
- 說明：Google 推出讓 AI 代理操作網頁介面
- 資源：📖 官方文件 📝 iThome 報導 🐙 GitHub
2025-10-10｜SurfSense
- 說明：GitHub 萬星王炸，整合 Slack/Notion/Jira
- 資源：📝 MODSetter 📝 中文解讀
2025-08-29｜Microsoft Agent Framework
- 說明：開放原始碼開發套件，用於建置 .NET 和 Python 的 AI 代理程式和多代理程式工作流程。
- 資源：🐙 GitHub 📝 官方文件
2025-08-29｜MiroThinker
- 說明：開源的深度研究代理，針對研究和預測進行了最佳化。
- 資源：🐙 GitHub 📝 公眾號解讀
2025-07-03｜multi-modal-researcher
- 資源：🐙 GitHub
2025-06-25｜Gemini CLI
- 說明：你的開源 AI 代理
- 資源：🐙 GitHub 📝 Google Blog
2025-06-06｜PandaWiki
- 說明：新一代 AI 大模型驅動的開源知識庫
- 資源：🐙 GitHub 📝 中文解讀
2025-06-03｜Gemini Fullstack LangGraph
- 說明：開源版 Perplexity
- 資源：📚 DeepWiki 🌐 DEMO 📝 53AI 報導
2025-06-03｜Perplexica
- 說明：Perplexity AI 開源替代品
- 資源：🐙 GitHub 📝 53AI 報導
2025-06-02｜Paper2Poster
- 說明：自動為論文產生海報
- 資源：🌐 Project 📝 中文解讀
2025-06-01｜Agent Zero
- 說明：全能 AI 代理（產生APP、程式碼、RAG）
- 資源：🐙 GitHub 🌐 官網 📝 騰訊雲文章
2025-05-30｜WebDancer
- 說明：Alibaba 開源 WebAgent
- 資源：📄 AlphaXiv 📚 DeepWiki
2025-05-28｜Lemon AI
- 說明：全球首款全端開源通用 AI Agent
- 資源：🐙 GitHub 📝 53AI 報導
2025-05-25｜OpenHands
- 資源：🐙 GitHub 🌐 Demo
2025-05-18｜Agent-Squad
- 說明：輕量級開源 AI 多智能體框架 (AWS Labs)
- 資源：📚 DeepWiki 📝 中文解讀
2025-05-10｜FlowGram (ByteDance)
- 說明：字節跳動開源 Coze 核心工作流引擎
- 資源：🐙 GitHub 📝 公眾號解讀 📚 DeepWiki
2025-05-10｜DeerFlow
- 說明：字節跳動 DeerFlow 解析
- 資源：🐙 GitHub 📝 深度解析 📚 DeepWiki
2025-05-09｜OpenDeepWiki
- 說明：加入 MCP，讓 AI 掌握開源專案文件
- 資源：🐙 GitHub 📝 公眾號解讀 📚 如何使用
2025-05-07｜AI Manus
- 資源：📚 DeepWiki
2025-04-24｜suna
- 說明：Manus 開源平替
- 資源：🐙 GitHub 📝 機器之心
2025-04-22｜釦子空間 (Coze Space)
- 說明：字節版 Manus
- 資源：🌐 官網 📝 知乎解讀
2025-04-03｜AutoAgent
- 說明：港大打造開源最強 Deep Research
- 資源：🐙 GitHub 📝 公眾號解讀
2025-04-03｜Agent Development Kit (ADK)
- 說明：Google 智能體開發工具包
- 資源：🐙 GitHub 📝 53AI 報導
2025-04-03｜Deepsite
- 說明：基於 DeepSeek 的網頁開發智能體
- 資源：🤗 Space 📝 知乎推薦
2025-03-30｜DeepGemini
- 說明：AI 界搭積木神器
- 資源：🐙 GitHub 📝 公眾號推薦
2025-03-24｜AgenticSeek
- 說明：Manus 完全本地化替代品
- 資源：🐙 GitHub 📝 公眾號推薦
2025-03-20｜DeepSearcher
- 說明：私有資料 + Deepseek 打造本地 Deep Research
- 資源：📝 DeepSearcher 📝 知乎解讀
2025-03-11｜autoMate
- 說明：基於 OmniParser 的 AI 自動化助手
- 資源：🐙 GitHub 📝 公眾號推薦
2025-03-10｜OpenManus
- 資源：🐙 GitHub 📝 一文讀懂
2025-02-28｜MoneyPrinterTurbo
- 說明：AI 自動生成高清短視頻
- 資源：🐙 GitHub 📝 知乎推薦
2024-02-01｜MobileAgent
- 說明：多模態手機助理
- 資源：🐙 GitHub 📝 知乎解讀
2025-01-03｜smolagents
- 說明：Hugging Face 開源 Agent 框架
- 資源：🐙 GitHub 📝 CSDN 介紹
2024-10-26｜OmniParser
- 說明：微軟開源，控制電腦手機的智能體
- 資源：🐙 GitHub 📝 知乎解讀
2024-09-23｜STORM
- 說明：基於 LLM 的知識整理系統 (Stanford)
- 資源：🐙 GitHub 📝 公眾號介紹

Tools

🛠️ 開發工具 (Tools & Protocols)

MCP (Model Context Protocol)

2025-08-20｜FastAPI-MCP
- 說明：將 FastAPI 介面升級為 MCP 工具服務
- 資源：📝 zread 📝 公眾號教學
2025-04-15｜automcp
- 說明：秒設定 MCP 伺服器
- 資源：🐙 GitHub 📝 公眾號介紹
2025-04-10｜line-bot-mcp-server
- 資源：🐙 GitHub
2025-04-05｜GitMCP
- 說明：讓 AI 秒懂 GitHub 項目
- 資源：🐙 GitHub 📝 53AI 報導
2025-03-14｜playwright-mcp
- 說明：AI 自動化神器
- 資源：🐙 GitHub 📝 知乎解讀

Browser Automation (瀏覽器自動化)

Browser-use
- 資源：🐙 GitHub
- 2025-06-04：workflow-use (一次錄製，永久使用)
- 2025-04-16：web-ui 📚 如何使用
- 2025-03-28：browser-use-webui
- 2025-02-16：webui 部署教學
- 2025-01-23：讓 AI 像人類一樣使用瀏覽器

效率工具 (Efficiency Tools)

2025-12-20｜NVIDIA Nemotron-3-Nano
- 資源：🤗 HuggingFace 🌐 OpenRouter
2025-11-20｜LinearRAG
- 說明：全新 RAG 框架，無需關係抽取
- 資源：🐙 GitHub 📝 知乎解讀
2025-09-11｜DeepMCPAgent
- 說明：教你讓模型自己「找工具」
- 資源：📝 zread 📝 公眾號解讀
2025-07-30｜LangExtract
- 說明：Gemini 驅動的資訊擷取庫
- 資源：🐙 GitHub 📝 Google Developers
2025-06-28｜docext
- 說明：基於 Qwen2.5VL 的文檔解析工具
- 資源：🐙 GitHub 📝 知乎解讀
2025-06-10｜Agentic-Doc
- 說明：LandingAI 開源，百頁文檔秒變結構化資料
- 資源：🐙 GitHub 📝 知乎解讀
2025-06-06｜daily-arXiv-ai-enhanced
- 說明：每日爬取 arXiv 並用 LLM 產生中文摘要
- 資源：🐙 GitHub
2025-05-22｜AingDesk
- 說明：零門檻本地 AI 部署
- 資源：📚 DeepWiki 📝 知乎解讀
2025-05-20｜news-agents
- 資源：📚 DeepWiki
2025-05-16｜Follow
- 說明：資訊聚合神器
- 資源：📚 DeepWiki 📝 知乎推薦
2025-05-11｜SurfSense
- 說明：打通 Notion/GitHub 的 AI 超腦
- 資源：🐙 GitHub 📝 公眾號推薦 📚 如何使用
2025-04-28｜PaperCoder (Paper2Code)
- 說明：Automating Code Generation from Scientific Papers
- 資源：📚 DeepWiki 📄 AlphaXiv
2025-04-16｜OneFileLLM
- 說明：一鍵聚合網頁、程式碼、論文到剪貼簿
- 資源：🐙 GitHub 📝 公眾號推薦
2025-04-16｜ScrapeGraphAI
- 說明：自然語言驅動的智慧爬蟲
- 資源：🐙 GitHub 📝 公眾號推薦
2025-04-15｜stagehand
- 說明：AI 驅動的下一代瀏覽器自動化框架
- 資源：🐙 GitHub 📝 公眾號推薦
2025-04-11｜nanobrowser
- 說明：AI 驅動的瀏覽器自動化神器
- 資源：🐙 GitHub 📝 公眾號推薦
2025-04-10｜DevDocs
- 說明：開發者的文檔收割機
- 資源：🐙 GitHub 📝 公眾號推薦
2025-04-06｜sqlchat
- 說明：讓資料庫管理像聊天一樣簡單
- 資源：🐙 GitHub 📝 公眾號推薦
2025-03-26｜pdf-craft
- 說明：PDF 秒轉 Markdown/EPUB
- 資源：🐙 GitHub 📝 知乎推薦
2025-03-25｜OCRmyPDF
- 說明：能力分析
- 資源：🐙 GitHub 📝 知乎分析
2025-03-12｜AingDesk (同上)
- 資源：📚 DeepWiki 📝 知乎解讀
2025-03-08｜composio
- 說明：AI 助理效率神器，整合 200+ 工具
- 資源：🐙 GitHub 📝 公眾號推薦
2025-02-25｜PySpur
- 說明：拖曳式開發 AI 工作流程
- 資源：🌐 官網 📝 知乎解讀
2025-01-13｜DocAligner
- 說明：拍照文件復原 (校正、版面定位)
- 資源：🐙 GitHub 📝 公眾號推薦
2025-01-07｜activepieces
- 說明：開源 AI 自動化工作流程工具
- 資源：🐙 GitHub 📝 公眾號推薦
2024-12-19｜LightRAG
- 資源：🐙 GitHub 📝 技術框架解讀
2024-12-15｜markitdown
- 資源：🐙 GitHub

AI PTT

🌍 AI PPT (用AI做PPT)

2026-01-04 LangChat Slides
- 說明：基於生成式AI 的智慧幻燈片生成工具，由LangChat 團隊開發。
- 資源：🐙 GitHub DEMO 掘金解讀
2025-12-13 banana-slides
- 說明：基於nanobananapro🍌的原生AI PPT生成應用，邁向真正的「Vibe PPT」。
- 資源：🐙 GitHub 📝 公眾號推薦
2025-07-26｜presenton
- 說明：本地部署一鍵生成精美 PPT
- 資源：🐙 GitHub 📝 公眾號推薦
2025-07-03｜MultiAgentPPT
- 說明：多智能體並發產生 PPT
- 資源：🐙 GitHub 📝 知乎解讀
- 2025-01-13｜PPTAgent
- 說明：中科院開源 AI 工具，文件轉高品質 PPT
- 資源：🐙 GitHub 📝 知乎推薦

NotebookLM 平替

🌍 NotebookLM 平替

2026-01-04 Notex
說明：一個開源 NotebookLM 替代方案的實現
- 資源：🐙 GitHub 📝 公眾號推薦
- DEMO
2025-12-06 Open NoteBook
說明：一個開源的、注重隱私的Google Notebook LM 替代方案
- 資源：🐙 GitHub 📝 知乎解讀 📝 公眾號解讀
2025-12-06 Auto-Slides
說明：不只是幫你寫，還能幫你講。它讓論文第一次有機會“開口說話”
- 資源：🐙 GitHub 📝 知乎解讀

World Models

🌍 World Models (世界模型)

2025-09-25｜Code World Model
- 說明：Yann LeCun 攜 320 億參數開源世界模型
- 資源：📝 Meta Research 📝 新浪報導

MoE

🧠 MoE (混合專家模型)

2024-12-13｜DeepSeek-VL2
- 說明：VLM 邁入 MoE 時代
- 資源：🐙 GitHub 📝 機器之心 📝 公眾號
騰訊混元 (Hunyuan-Large)
- 說明：騰訊最大 MoE 大模型
- 資源：🐙 GitHub 🤗 DEMO 🤗 Model 📝 機器之心

SLM

📱 Small Language Models (小型語言模型)

2025-01-07｜Smolagents
- 說明：Hugging Face 全新 AI 智能體框架
- 資源：🐙 GitHub 📝 知乎解讀
2024-12-13｜Phi-4
- 說明：微軟 Phi-4 正式發表，以小博大
- 資源：🤗 HuggingFace 📝 公眾號
2024-11-18｜MobileLLM-1.5B
- 說明：Meta 打造行動裝置超強語言模型
- 資源：🤗 HuggingFace 📝 公眾號
2024-11-04｜SmolLM2
- 說明：手機執行的小型語言模型
- 資源：🤗 HuggingFace 📝 iThome
2024-09-25｜Llama 3.2
- 說明：1B/3B 端側模型 (Edge AI)
- 資源：📝 Meta Blog

Reasoning

🤔 Reasoning Models (推理模型)

2025-08-05｜gpt-oss
- 說明：OpenAI 重新開源，o4-mini 水平
- 資源：🤗 HuggingFace 📝 OpenAI Blog 📝 機器之心
2025-07-29｜Llama Nemotron Super v1.5
- 說明：英偉達開源，三倍吞吐、單卡可跑
- 資源：🤗 HuggingFace 📝 知乎解讀
2025-07-27｜OpenReasoning-Nemotron
- 說明：英偉達數學核武，1.5B 參數秒殺 o3
- 資源：🤗 HuggingFace 📝 公眾號解讀
2025-05-06｜Llama-Nemotron
- 說明：英偉達高效推理系列
- 資源：📄 AlphaXiv 📚 DeepWiki 📝 知乎解讀
2025-04-16｜Video-R1
- 說明：Reinforcing Video Reasoning in MLLMs
- 資源：📄 AlphaXiv 🐙 GitHub 📝 36Kr 報導

LLM

🏛️ Large Language Models (大型語言模型)

2025-08-05｜Claude Opus 4.1
- 資源：📝 機器之心
2024-11-23｜Ai2 Tülu 3
- 說明：真・開源模型，公開「後訓練」一切
- 資源：🐙 GitHub 🌐 Playground 🤗 Model 📝 機器之心
2024-11-09｜Ai2 OpenScholar
- 資源：📝 Blog 🌐 Project
2024-09-25｜Llama 3.2 90b/11b
- 資源：📝 Meta Blog

Embedding

🔎 Embedding & Reranker

2025-07-14｜Gemini Embedding 001
- 資源：☁️ Google Cloud
2025-06-05｜Qwen3 Embedding
- 說明：新一代文本表徵與排序模型
- 資源：📝 Qwen Blog 🤗 Embedding 🤗 Reranker

Speech

🔊 Speech-to-Speech LLM (語音大模型)

TEN Agent
- 說明：王炸級開源端對端語音模型
- 資源：🐙 GitHub 📝 公眾號 📝 入坑記 📝 搭建教學
pipecat
- 說明：用 ChatGPT 即時語音 API 建立應用
- 資源：🐙 GitHub 📝 機器之心

2026-01-15

PersonaPlex-7B-V1

說明：重塑實時語音交互的 “全雙工” 黑科技 👉 點此看深度技術分析

資源：🤗 HuggingFace