Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷,是為了普及與分享深度學習及AI領域的尖端知識,深信AI的價值在於解決真實世界的商業問題。

Deep Learning 101 TonTon H.-D. Huang Ph.D.


🎨 Diffusion Model 擴散模型完全解析:從原理到實作

生成式 AI 不僅在文字領域發光發熱,基於「擴散模型 (Diffusion Model)」的圖像與影片生成技術更是迎來了寒武紀大爆發。本頁面為你統整當今最強大的開源繪圖與影音生成生態系,帶你快速掌握各項工具的實作重點。

作者TonTon Huang Ph.D.
原文出處Diffusion Model 完全解析:從原理、應用到實作 (發布於 2024/11/01)


🖼️ 基礎核心與工作流工具

1. 擴散模型與 Stable Diffusion (SD)

擴散模型是透過「不斷加入雜訊再逐步還原」的數學過程來生成極高畫質的圖像。以 Stable Diffusion 為首的開源技術,目前已完美支援以下核心功能:

2. ComfyUI 模組化工作流

目前最強大的 AI 圖像生成圖形介面。捨棄了傳統的按鈕式面板,改用「節點連線 (Node-based)」的方式。


🔥 新世代霸主:FLUX.1 生態系

由 Black Forest Labs 推出的 FLUX 模型,在畫面細節與文字理解能力上大幅超越了前代開源模型。

版本分支:

專屬 Control 輔助工具:

FLUX.1 配備了強大的可控生成工具集:


🎬 邁向動態:最新開源影片生成模型 (Video Generation)

隨著 DiT (Diffusion Transformer) 架構的成熟,開源社群的影片生成技術已達到電影級別的畫質與流暢度。

1. 阿里雲 Wan2.1 (通義萬象)

2. 騰訊 HunyuanVideo-I2V (混元)

3. 階躍星辰 Step-Video-TI2V


💡 結語:從靜態的 FLUX 到動態的 Wan2.1 與 HunyuanVideo,開源 AI 的進化速度前所未見。掌握 ComfyUI 的節點邏輯並合理配置硬體資源,你也能在本地端打造出自己的好萊塢級製片廠!