AI 融入教育的思辨與反思之三-架設本地AI的考量

by阿Samn的物理課本 -5月 03, 2026

0

用家中Qnap 裝openweUI，M1pro(32GB) 裝 Gemma4 26B 及31B 兩個模型，測試擷取增強生成 (RAG)是否符合學校教師使用，以評估是否申請經費購買相應的顯示卡，安裝到校內2U伺服器上，進行本地AI架設。

目前測試結果是

不考慮vibecoding，整理資料內容屬於還可以的狀態，就是回應速率頗慢，會聽到M1pro 風扇狂轉的聲音。
要求26B 以RAG產生新題目，會出現中斷輸出等狀態。
要求31b 以RAG方式產生新題目，能穩定輸出成果，但題目可用性堪憂，需要人為大規模除錯，例如：
可以猜猜問題在哪裡

結論：
1.至少需要 70B以上模型，26B/31B的模型可能有足夠的推理能力，但沒有夠多的參數來捕捉上下文的關聯，定位關鍵資訊，進而產生幻覺。

2.至於使用校內舊伺服器是為了省錢。

閒置2U伺服器本身有足夠的多人共同連線能力，但兜到64GB的VRAM，估算需要40~50萬。

看起來很貴，但我們來算點帳就知道，這是已經最省錢的方式

假設設備攤提期為 3 年（36 個月），每月硬體折舊成本約為 NT$ 1.3萬~1.4萬。同時，雲端訂閱 (以 ChatGPT Plus / Gemini Advanced 為例)：目前單人訂閱費用約為 US$ 20/月 (約 NT$ 660)，也就是說校內只有20人以上願意使用本地AI，就能打平這項支出。

同時這樣配置，在考量考慮使用者「輸入-閱讀-思考」的間隔，預估能支撐50人左右同時連線。

真正重要的是資料隱私性-資料鎖在校內伺服器，沒有外流到Google/Claude等商業公司中，亦即您的獨家教學思維、特殊的題目設計，絕對不會在未來的某個版本中，變成全球 AI 都能回答的資料庫內容。

Tags 教學記事電腦資訊系列文章 AI

AI 融入教育的思辨與反思之三-架設本地AI的考量

發佈留言

無法使用Gemini Code Assist Agent模式

聯絡人表單