Deep Learning 101, Taiwan’s pioneering and highest deep learning meetup, launched on 2016/11/11 @ 83F, Taipei 101

AI是一條孤獨且充滿惶恐及未知的旅程,花俏絢麗的收費課程或活動絕非通往成功的捷徑。
衷心感謝當時來自不同單位的AI同好參與者實名分享的寶貴經驗;如欲移除資訊還請告知。
TonTon Huang Ph.D. 發起,及其當時任職公司(台灣雪豹科技)無償贊助場地及茶水點心。
Deep Learning 101 創立初衷,是為了普及與分享深度學習及AI領域的尖端知識,深信AI的價值在於解決真實世界的商業問題。

Deep Learning 101 TonTon H.-D. Huang Ph.D.


🗣️ 那些語音處理 (Speech Processing) 踩的坑:從識別到去噪實戰

語音處理是一門極度考驗信號處理與深度學習結合的領域。本文記錄了團隊在語音識別 (ASR)、聲紋辨識、語音去噪與模型輕量化等任務中的實作經驗與心得。

作者TonTon Huang Ph.D.
原文出處那些語音處理 (Speech Processing) 踩的坑 (發布於 2021/04/26)


🛠️ 核心研究領域與實戰經驗

1. 聲紋識別 / 語者識別 (Speaker Recognition)

2. 語音識別 (ASR) 與 Kaldi 工具包

3. 語音增強 / 去噪 (Speech Enhancement)

4. 語者分離 (Speaker Separation)

5. 模型壓縮與加速推論 (Model Compression & Inference)


💡 結語:語音處理系統的落地,不只要追求模型在乾淨語料上的高分,更要解決現實中充滿噪音、多人交談的複雜場景。透過完善的前處理去噪與後端的模型壓縮,才能打造出真正實用的 AI 語音服務。