Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

Logo TonTon
AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,特別感謝時任職公司台灣雪豹科技無償贊助場地及茶水點心。
這裡不僅匯集了我們歷年的 Meetup 紀錄,更是 AI 演算法與開源資源匯整中心。
👉 查看 Deep Learning 101 歷年所有實體 Meetup 影像與逐字稿 📺

🔥 嚴選 (必讀)
🛠️ 工具、論文、趨勢、科普、踩坑
🛠️ 實戰工具 & Agent 框架
📝 論文快遞
📝 產業趨勢
🚧 踩坑指南 & 科普入門
🛡️ AIxCC 競賽

🎨 Diffusion Model 擴散模型完全解析:從原理到實作

生成式 AI 不僅在文字領域發光發熱,基於「擴散模型 (Diffusion Model)」的圖像與影片生成技術更是迎來了寒武紀大爆發。本頁面為你統整當今最強大的開源繪圖與影音生成生態系,帶你快速掌握各項工具的實作重點。

作者TonTon Huang Ph.D.
原文出處Diffusion Model 完全解析:從原理、應用到實作 (發布於 2024/11/01)


🖼️ 基礎核心與工作流工具

1. 擴散模型與 Stable Diffusion (SD)

擴散模型是透過「不斷加入雜訊再逐步還原」的數學過程來生成極高畫質的圖像。以 Stable Diffusion 為首的開源技術,目前已完美支援以下核心功能:

2. ComfyUI 模組化工作流

目前最強大的 AI 圖像生成圖形介面。捨棄了傳統的按鈕式面板,改用「節點連線 (Node-based)」的方式。


🔥 新世代霸主:FLUX.1 生態系

由 Black Forest Labs 推出的 FLUX 模型,在畫面細節與文字理解能力上大幅超越了前代開源模型。

版本分支:

專屬 Control 輔助工具:

FLUX.1 配備了強大的可控生成工具集:


🎬 邁向動態:最新開源影片生成模型 (Video Generation)

隨著 DiT (Diffusion Transformer) 架構的成熟,開源社群的影片生成技術已達到電影級別的畫質與流暢度。

1. 阿里雲 Wan2.1 (通義萬象)

2. 騰訊 HunyuanVideo-I2V (混元)

3. 階躍星辰 Step-Video-TI2V


💡 結語:從靜態的 FLUX 到動態的 Wan2.1 與 HunyuanVideo,開源 AI 的進化速度前所未見。掌握 ComfyUI 的節點邏輯並合理配置硬體資源,你也能在本地端打造出自己的好萊塢級製片廠!

🤖
Deep Learning 101 小助手