Sovereign Heuristic Intelligence & Enterprise Logic Defense (主權啟發式情資與企業邏輯防禦系統)
🎵 不聽可惜的 NotebookLM Podcast @ Google 🎵
Your Private Cloud, Your Proprietary Brain, Your Digital Workforce (從算力基建到數位員工的一站式轉型服務)
通用 AI 無法滿足企業的剛性需求:企業需要的不是單純的 Chatbot,而是具備『絕對主權』的數位勞動力。
PyRIT / Inspect AI 為大腦中樞,自動調度 20+ 套 AI 資安攻防兵器(如 Garak, TruLens, GuardVal),對系統進行極限壓力測試,並將防禦數據一鍵封裝為具備公信力的《ISO 42001 獨立驗證報告底稿》。
主權啟發式情資與企業邏輯防禦系統 專案概述 (Overview)
在短短不到兩年的時間裡,企業 AI 的應用典範已經歷了三次劇烈的底層革命。S.H.I.E.L.D. 的誕生,正是為了解決前兩個世代的致命缺陷,並定義第三世代的企業安全標準:
【S.H.I.E.L.D. 的誕生與雙重防禦危機】
在上述 Gen 3 的演進下,金融、政府與半導體等高度監管產業極需 AI 轉型,但無法承受將內部機敏拓樸、營業秘密上傳至公有雲的風險。因此,打造企業專屬的 Private Cloud 與 Proprietary Brain (主權大腦) 已成為不可逆的趨勢。
然而,當主權 AI 透過微調吸收了企業所有的機密邏輯後,這顆「無所不知的私有大腦」立刻面臨著雙重危機:
為此,我們開發了 S.H.I.E.L.D.。專為「企業主權 AI」量身打造,利用強大算力向外跨足明暗網狩獵威脅,向內進行深度連鎖關聯推理(融合 Vectorless RAG 與圖譜引擎),並結合 ChatOps 授權機制,賦予企業 AI 察覺威脅、保護機密與自我修復的強韌生命力。
S.H.I.E.L.D. 具備顛覆傳統資安被動防禦思維的核心特色,為企業主權大腦建構了四大主動免疫機制:
👉 核心目標:禦敵於國門之外,縮減 0-day 漏洞的空窗期。
作為 S.H.I.E.L.D. 向外打擊與防堵的利器,上述的核心防禦機制具體化為四個動態運行階段 (Phases),結合完善的健康度監測,構築了堅不可摧的企業外圍防護網:
👉 核心目標:防堵提示詞注入、越獄騙局與 AI 幻覺,並產出符合 ISO 42001 的獨立驗證報告。
在外部的威脅狩獵與網路熱修補 (Phase 1~3) 之外,針對「企業 AI 大腦本身」的語意安全與合規性,S.H.I.E.L.D. 導入了核心的微調技術 (Fine-Tuning) 與邏輯層護欄 (Guardrails),並嚴格落實 企業級 AI 標竿分析與負責任 AI 治理建議:
採用 Microsoft PyRIT / Inspect AI 作為中央控制台,全自動排程並呼叫下方所有兵器。
透過 DeepAudit 掃描程式碼漏洞,Protect AI 攔截被植入木馬的開源權重 (.safetensors),並使用 IBM AIF360 確保訓練資料無算法偏見。
Gemma-4-31B-CRACK (無審查模型) 作為引擎,掛載 Garak 與 FuzzyAI,發動數萬次越獄與提示詞注入攻擊。NVIDIA NeMo Guardrails,內載 ShieldGemma 2 與 微調 ModernBERT 構成的毫秒級雙層護欄;並以 Microsoft Presidio 進行即時 PII 遮罩。GuardVal 計算護欄的漏擋率 (MAPR),呼叫 TruLens/Ragas 精準量化 RAG 系統的幻覺分數 (Groundedness)。透過內建此機制,我們完美落實了透明性、可解釋性 (透過 SHAP 特徵歸因)、公平性與問責機制。
S.H.I.E.L.D. 的外層防禦,負責把駭客與病毒擋在網路邊界之外;而內層防禦,則是為企業的 AI 大腦穿上防彈衣,確保它吐出的每一句話都安全、聰明且絕對合規。
| 比較維度 | ⚔️ 外層防禦 (Outer Defense) | 🧠 內層防禦 (Inner Defense) |
|---|---|---|
| 防禦目標 | 企業基礎設施 (伺服器、網路)、IT 資產 | 企業主權 AI 大腦本身、數據決策邏輯 |
| 對抗威脅 | 0-day 漏洞、惡意軟體、進階持續性威脅 (APT)、已知駭客攻擊 (PoC) | 提示詞注入 (Prompt Injection)、越獄騙局、AI 幻覺 |
| 運作機制 | 向外狩獵 (暗網) ➔ 雙引擎檢索推演 ➔ 網路層熱修補 | 向內微調 (SOP) ➔ 護欄審核 ➔ 紅藍隊攻防演練 |
| 防護領域 | 傳統資訊安全 (Cybersecurity) | AI 安全與治理 (AI Safety & Governance) |
| 白話比喻 | 具備雷達的城牆防禦系統,精準推演敵軍路徑並自動發射攔截導彈 | 國王身邊的貼身侍衛與最高檢察官,防止國王被奸臣洗腦或做出違憲決策 |
| 應用領域 / 功能 | 核心工具與套件 | 說明與效益 |
|---|---|---|
| 企業大腦微調與部署 | Unsloth / vLLM / Ollama |
極速微調企業專屬業務模型,並於地端叢集高效推論,確保資料不落地。 |
| AI 推論與萃取 | Google GenAI(Gemini-2.5-flash) |
提供強大推論能力,並可無縫切換本機端 Ollama 實現 100% 離線推論。 |
| AI 數據精煉與合成 (Data Refinery) |
PageIndex / OpenDataLoader-PDF / NVIDIA NeMo Retriever / NVIDIA NeMo Data Designer |
突破 PDF 解析極限,並結合 NeMo 工具鏈自動化生成高保真合成數據,為大腦提供純淨微調燃料。 |
| 自動化與圖譜運算 (GraphRAG Engine) |
Streamlit / NetworkX / PyVis |
互動式威脅拓樸渲染與連鎖衝擊路徑可視化。開源版提供 CSV 匯入作 PoC 驗證,真實環境可透過 Enterprise Connectors 介接。 |
| AI 治理與語意防火牆 | NVIDIA NeMo Guardrails / Nemotron-Safety-Guard |
建構可程式化的邏輯護欄,微調並部署專職裁判模型,防範提示詞注入與違規決策。 |
| 決策軌跡與紅藍對抗 | LangGraph / Langfuse |
建構多代理人 (Multi-Agent) 攻防狀態機,完整記錄 AI 思考日誌以落實可追責性。 |
| 暗網與情資探勘 | Tor (SOCKS5 Proxy) / Headless OSINT Scraper |
隱匿追蹤並深潛暗網駭客論壇,客製化萃取高價值的零時差威脅情資。 |
| 數位員工與自動化 | Hermes / OpenClaw / LINE Messaging API |
導入擁有近 40 萬 GitHub Stars 的頂級 Agent 框架 OpenClaw。原生整合 LINE 實現 ChatOps 授權,賦予大腦安全、受控的本機執行能力 (SSH/CLI)。 |
| 多代理人基礎設施 | Multica |
作為 AI 團隊的任務看板與基礎設施 (Harness)。提供安全的執行沙盒、權限範圍 (Scope) 控管與工單指派,確保 OpenClaw 的每一次行動皆有跡可循。 |
| 靜態與供應鏈聯防 | DeepAudit / Protect AI / Microsoft RAMPART |
掃描底層程式碼漏洞與 RAG 權限缺陷;攔截遭竄改的模型權重,落實 CI/CD 安全迴歸測試。 |
| 動態護欄與隱私 | NVIDIA NeMo Guardrails / ShieldGemma 2 / Microsoft Presidio / Opacus |
毫秒級雙層護欄攔截惡意越獄;即時文字 PII 動態遮罩;差異隱私數學邊界防護。 |
| 全自動審計與量化 | Microsoft PyRIT / Garak / TruLens / GuardVal / IBM AIF360 |
構建全自動審計工作流。發動多輪漸強攻擊,並精準計算護欄防禦率與幻覺分數,自動對齊 ISO 42001 產出合規底稿。 |
| 核心技術亮點 | 獨特性與實作細節 |
|---|---|
| 傳統 RAG 演進至 雙引擎檢索 (Sovereign GraphRAG + Vectorless RAG) |
徹底揚棄臃腫的向量資料庫 (Vector DB): • 針對結構化關聯:採用圖論引擎進行立體映射推演,在地端讀取內部拓樸。 • 針對長篇機密文檔 (如 ISO/SOP):導入 Agentic Vectorless RAG (代理人無向量目錄索引) 實現 100% 零幻覺的精準導航。 • 兩者結合,建立公有雲無法跨越的絕對護城河。 |
| LLM 雙層防禦與 雙腦架構 (Dual-Layer & Dual-Brain Defense) |
跳脫單一模型的風險盲區,打造極致的內外防禦網: • 對外 (網路層):以 LLM-to-IPS 實現自動化熱修補,縮短 0-day 空窗期。 • 對內 (認知層):導入 「Actor-Judge 雙腦架構」。由「業務大腦 (Actor)」負責深度情資推導;同時隱藏一個微調過的「護欄大腦 (Judge)」作為語意防火牆。結合紅藍隊動態 Fuzzing 持續鍛鍊護欄,將防禦升級為具備神經可塑性的「主動免疫系統」。 |
| 從龐大算力演進至 極致輕量 (Edge AI & Quantization) |
採用知識蒸餾訓練專用 SLM (Small Language Model): • 導入 4-bit 量化 (AWQ/GGUF) 與語意路由 (Semantic Routing)。 • 大幅降低硬體 TCO (總體擁有成本) 門檻。 |
| 底層數據解析的 典範轉移 (Data Parsing Paradigm Shift) |
捨棄傳統 1D 純文字流,邁向 2D 物理版面感知: • 零 LLM 延遲建檔:揚棄依賴昂貴 LLM 腦補目錄的舊法。導入 OpenDataLoader,利用底層電腦視覺瞬間抽取出帶有精準座標 (Bounding Box) 的實體 JSON 目錄,建檔過程 100% 零 LLM 呼叫成本。• 消滅表格與排版幻覺:本系統透過物理版面解析,完美識別 heading、table、picture 錨點,結合 PyMuPDF 截取原圖,確保圖文多模態資訊在建檔階段 0% 遺失。• 絕對客觀的目錄樹 (Truthfulness):拒絕由 AI 總結出來的虛假目錄。檢索地圖 100% 建立在原生文檔的物理字體、縮排與版面上,徹底斬斷 RAG 在檢索前期的幻覺根源。 |
在資安的真實戰場中,沒有絕對完美的架構。S.H.I.E.L.D. 為了追求「絕對的資料主權與物理斷網」,在設計上做出了明確的戰略取捨。我們誠實面對地端系統的邊界,並以硬核技術進行完美緩解:
「安全、無懼地保護並使用專屬 AI」才是決勝 AI 的關鍵。
S.H.I.E.L.D. 透過向外的敏銳探勘、向內的圖譜深思,結合 「網路層即時熱修補」與「紅藍隊自主大腦演化」 的雙層免疫機制,為企業打造具備真實生命力的數位防禦中樞,引領台灣產業邁向真正安全的主權 AI 時代。
S.H.I.E.L.D. 開源版本提供核心的防禦框架與概念驗證 (PoC) 工具。針對高度監管產業與大型企業的實戰需求,我們提供客製化的導入服務與企業版授權:
init_ontology.py),提供與 ServiceNow、Active Directory、GRC 系統的自動化 API 同步,動態即時更新防禦圖譜。NVIDIA NeMo Data Designer 的完整微調數據生成腳本與參數調優顧問服務,確保模型 100% 理解企業專屬術語與 SOP。📩 商務合作與技術諮詢,請聯繫:TonTon [@] TWMAN.ORG
本開源庫所展示的,為 S.H.I.E.L.D. 核心演算法之概念驗證 (PoC),旨在證明雙引擎檢索與零信任 AI 推理之強大潛力。
在實際的企業交付中,多代理人狀態機 (Multi-Agent State Machine)、動態權限過濾 (RBAC) 以及 NeMo 邏輯護欄的熱重載機制 需深度依賴企業內部的 AD 網域與 GRC 系統。這些模組涉及高度客製化的 Data Pipeline,為企業版專屬之授權服務。
系統依賴 Tor 來存取 .onion 網站,請確保您的系統已安裝並在背景執行 Tor (預設監聽 127.0.0.1:9050)。
sudo apt install tor && sudo systemctl start torbrew install tor && brew services start torsudo apt install tor。請確認您的 Python 版本為 3.10+。
git clone https://github.com/Deep-Learning-101/SHIELD.git
cd SHIELD
pip install -r requirements.txt
請在專案根目錄建立 .env 檔案,並填寫您選用的 LLM API Key (以 Gemini 為例):
GOOGLE_API_KEY=your_google_gemini_api_key
# 若您想使用 OpenAI 或本地端 Ollama,可額外設定:
# OPENAI_API_KEY=your_openai_api_key
# OLLAMA_BASE_URL=http://127.0.0.1:11434
python -m streamlit run app.py --server.port 8000 --server.address 0.0.0.0
Phase 1 操作:防禦本體渲染
開啟瀏覽器進入 http://localhost:8000。於左側邊欄選擇「載入企業預設防禦矩陣 (Default-Matrix)」,系統將自動渲染您的企業防禦圖譜,完成資產與法規的映射。
Apache 2.4.49 exploit)。Y 進行審批放行 (Human-in-the-loop)。# 安裝 Phase 5 模組
cd modules/eval
./scripts/setup_conda_env.sh
conda activate shield-audit-env
# 配置審計目標
cp config/audit_config.example.yaml config/audit_config.yaml
vim config/audit_config.yaml
# 執行審計
./scripts/run_audit.sh
# 查看報告
cat ../../shared/data/audit_results/latest_summary.json
Phase 5 核心功能:
詳細文檔:請參閱 modules/eval/README.md
SHIELD/
├── app.py # 核心 Streamlit 儀表板與整合邏輯
├── search.py # 暗網搜尋引擎介接模組 (Tor)
├── scrape.py # 洋蔥網頁內文爬蟲模組
├── llm.py # LLM 意圖萃取與繁體中文情資總結
├── llm_utils.py # LLM 提供商 (Cloud/Local) 路由與設定
├── health.py # 系統健康度 (Tor/LLM) 檢測腳本
├── config.py # 環境變數載入
├── requirements.txt # Python 套件依賴清單
├── .env.example # 環境變數範例檔
└── data/ # 地端機敏資料庫 (Air-Gapped Vault)
├── enterprise_assets.db # 企業 IT 資產組態 (CMDB) 映射檔
├── compliance_matrix.db # 企業資安合規邏輯矩陣 (GraphRAG 用)
└── policies/ # 企業機敏原始文檔區 (PageIndex 用)
├── ISO_27001_2022.pdf # 長篇非結構化法規
└── Internal_SOP.md # 企業內部資安處置手冊
本專案開發之暗網探勘工具 (Phase 2) 僅供教育、學術研究與合法之網路安全防禦目的使用。存取部分暗網內容可能涉及您所在司法管轄區之法律規範。作者與貢獻者對於任何人不當使用本工具所造成之任何直接或間接損失、法律責任,概不負責。請務必在遵守相關法律與企業授權政策的前提下執行威脅狩獵。