VPN07

Gemma 3 手機完整教學 2026:iPhone / Android 用 4GB 跑 Google 開源 AI

2026-03-06 閱讀約 18 分鐘 Gemma 3 手機 AI 離線執行
開源大語言模型下載中心
Gemma 3 / DeepSeek / Phi-4 一站下載
立即下載模型 →

教學說明:Gemma 3 是 Google 專為各種設備優化的開源輕量大模型,從 1B 到 27B 參數不等,最輕量的版本只需 1.5GB 儲存空間,非常適合在手機上本機離線執行。本教學完整覆蓋 iPhone(iOS)使用 PocketPal AI 和 Enchanted 執行 Gemma 3,以及 Android 使用 MNN-LLM App 和 Termux 執行的完整步驟,讓你的手機真正成為一台隨身 AI 助理。

Gemma 3 為什麼特別適合手機執行?

Gemma 3 是 Google 在 2025 年發布的開源模型系列,其設計理念與 DeepSeek-R1 等旗艦模型不同——Gemma 3 從一開始就針對低耗能設備進行優化,包括 Android 手機、嵌入式設備和邊緣計算場景。在保持優秀輸出品質的同時,Gemma 3 的量化版本對記憶體的需求遠低於同規格競品。

以下是 Gemma 3 各版本的手機適配性分析:

版本 參數量 Q4 大小 最低 RAM 手機適用性
Gemma 3 1B 1B ~0.8 GB 4 GB RAM ✅ 入門手機也能跑
Gemma 3 4B 4B ~2.8 GB 6 GB RAM ✅ 中階手機最佳選擇
Gemma 3 12B 12B ~7.5 GB 12 GB RAM ✅ 旗艦手機(驍龍 8 Elite)
Gemma 3 27B 27B ~17 GB 24 GB RAM ❌ 手機不適用,需電腦
🔒

完全離線執行

無需網路連接,資料完全不離開手機

🔋

低耗電設計

Google 特別針對行動設備電池壽命優化

🌏

多語言支援

支援繁體中文、英文等 140+ 種語言

iPhone 安裝 Gemma 3:PocketPal AI 完整教學

PocketPal AI 是 iPhone 上最受推薦的本地 LLM 執行工具,完全免費,支援所有 GGUF 格式模型,包括 Gemma 3 的所有量化版本:

PocketPal AI 安裝步驟

1

App Store 下載 PocketPal AI

在 App Store 搜尋「PocketPal AI」,下載並安裝(免費,無需訂閱)。此 App 由開源社群維護,支援 iPhone 12 以上機型。

2

在 App 內搜尋 Gemma 3 模型

開啟 PocketPal AI,點選「Models」→「Search」,輸入 Gemma-3,找到對應版本:

Gemma-3-1B-IT-Q4_K_M.gguf(建議 6GB RAM 以下機型)

Gemma-3-4B-IT-Q4_K_M.gguf(建議 8GB RAM 機型)

Gemma-3-12B-IT-Q4_K_M.gguf(建議 12GB+ RAM 旗艦機)

3

下載模型(需 VPN07 加速)

點選目標模型的「Download」按鈕。1B 版本約 800MB,4B 版本約 2.8GB。建議在 WiFi 環境下先開啟 VPN07,下載速度可提升至 50-100 MB/s,讓 4B 版本在 30 秒內完成下載。

4

載入模型開始對話

下載完成後點選「Chat」分頁,選擇剛下載的模型,點選「Load」等待 5-15 秒模型載入完成,即可開始對話。第一次回應可能稍慢,後續速度會提升。

iPhone 機型推薦搭配

iPhone 15 / 14 / 13
6GB RAM → Gemma 3 1B 最佳
速度:約 20-30 tokens/s
iPhone 15 Pro / 16
8GB RAM → Gemma 3 4B 推薦
速度:約 15-25 tokens/s
iPhone 16 Pro Max
8GB RAM → Gemma 3 4B / 12B
速度:約 30-40 tokens/s

替代方案:Enchanted App(連接 Mac 上的 Ollama)

如果你的 iPhone 記憶體不足以直接執行 Gemma 3 12B,可以用 Enchanted App 連接同一 WiFi 下的 Mac 電腦上執行的 Ollama,讓 Mac 做推理運算,iPhone 當螢幕介面:

Mac 端

OLLAMA_HOST=0.0.0.0 ollama serve,然後 ollama pull gemma3:12b

iPhone 端

App Store 下載 Enchanted,設定伺服器地址為 http://Mac的IP地址:11434,即可用 iPhone 介面對話 Mac 上的 Gemma 3。

Android 手機安裝 Gemma 3:三種方法完整教學

Android 用戶有多種選擇,從最簡單的 App 到最彈性的 Termux 方式,以下依難易度排列:

A

方法一:MNN-LLM App(最簡單,阿里巴巴出品)

推薦新手

MNN-LLM 是阿里巴巴開源的 Android 本地 AI App,完全圖形化,支援 Gemma 3、Qwen3、Phi-4 等主流模型:

1

前往 GitHub 搜尋「MNN-LLM-Android」,下載最新 APK 安裝(需允許「未知來源」安裝)

2

在 App 內選擇「下載模型」,找到 Gemma-3 系列,根據手機 RAM 選擇 1B 或 4B 量化版

3

下載完成後點選「載入」開始對話,支援繁體中文介面

B

方法二:Termux + Ollama(最彈性)

推薦進階用戶

Termux 讓 Android 變成 Linux 環境,可以使用完整的 Ollama 命令列管理 Gemma 3:

# 從 F-Droid 安裝 Termux(不要用 Google Play 版)
# 安裝後執行:
pkg update && pkg upgrade -y
pkg install curl -y

# 安裝 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 下載 Gemma 3(根據手機 RAM 選擇版本)
# 6GB RAM 以下:
ollama pull gemma3:1b

# 8GB+ RAM:
ollama pull gemma3:4b

# 執行 Gemma 3
ollama run gemma3:4b

# 系統需求:驍龍 8 Gen 2+ 或天璣 9200+ 更流暢

💡 建議手機 RAM 8GB+,旗艦晶片(驍龍 8 Elite、天璣 9400)效果最佳。

C

方法三:AnyChatAI App(一站式 AI 應用)

對話體驗最佳

AnyChatAI 提供類似 ChatGPT 的完整對話介面,支援 Gemma 3 等主流模型,內建模型下載管理:

1

Google Play 搜尋「AnyChatAI」或「AI Chat Offline」,安裝免費版本

2

在「模型庫」中找到 Gemma 3 系列,下載 Q4 量化版本

3

選擇繁體中文介面(設定 → 語言),開始離線對話

手機執行 Gemma 3 的使用技巧

在手機上使用本地 AI 有幾個和電腦不同的注意事項,掌握這些技巧可以大幅提升使用體驗:

💡 保持 App 在前景避免被系統中止

iOS 和 Android 都有後台管理機制,切換 App 可能導致推理中斷。使用時建議保持 AI App 在前景。iPhone 用戶可以在「設定 → 一般 → 背景 App 重新整理」中為 PocketPal 開啟背景執行。

🔋 執行 AI 時接電源延長電池壽命

本地 AI 推理是高 CPU/GPU 負載任務,一般手機在推理時每分鐘電量消耗是正常使用的 3-5 倍。建議長時間使用時接上充電器,或使用行動電源。

🌡️ 注意手機溫度,避免過熱降頻

長時間推理會讓手機發熱,當溫度超過閾值時系統會自動降頻保護,導致輸出速度下降。建議在涼爽環境使用,並在推理過程中拿下手機殼幫助散熱。

💬 善用系統提示提升繁體中文品質

在 App 的「系統提示」設定中加入:「請始終使用繁體中文回覆,避免使用簡體中文字符。」這樣即使是英文問題,Gemma 3 也會自動用繁體中文回答。

Gemma 3 手機版最適合的使用場景

旅遊翻譯

在無網路的飛機或偏遠地區使用 Gemma 3 1B 進行即時翻譯,支援日文、韓文、英文等多種語言,離線也能完美運作。

文章摘要

把長文、PDF、新聞截圖的文字貼入,讓 Gemma 3 快速摘要重點,節省閱讀時間,無需擔心隱私資料上傳雲端。

文字潤飾

草稿寫好後貼入讓 AI 潤飾,改善表達方式,對於寫商業訊息、Email 或社群文章特別有用,且資料保持本地隱私。

程式碼輔助

Gemma 3 4B 有不錯的程式設計能力,可以在手機上解答程式問題、查找 bug 或生成小段程式碼,對開發者旅途中救急很方便。

為什麼模型下載這麼慢?VPN07 是解決方案

Gemma 3 的模型文件存放在 Google 的 HuggingFace 儲存庫,台灣直連下載速度通常只有 2-8 MB/s,下載 4B 版本(2.8GB)需要 6-20 分鐘。VPN07 提供 1000Mbps 千兆頻寬,連接後速度可達 50-100 MB/s,讓 4B 版本在 30 秒內下載完成。VPN07 擁有 70+ 國家節點、十年穩定運營、30 天退款保障,月費僅 $1.5,是手機 AI 玩家的必備工具。

手機跑 Gemma 3 常見問題

Q:iPhone 幾才能跑 Gemma 3?

A:iPhone 12 以上基本都可以跑 Gemma 3 1B 版本。iPhone 14 Pro 以上(8GB RAM)可以舒適執行 4B 版本。iPhone 16 Pro Max 可以嘗試 12B 的較輕量化版本。

Q:手機跑 AI 會不會傷害電池壽命?

A:短期使用不會。現代智慧型手機的電池管理系統能有效保護電池,但長期高溫高負載確實對電池健康有負面影響。建議:連充電器使用、保持手機溫度不過熱、不要連續執行超過 2 小時。

Q:Android 手機可以用哪些 App 跑 Gemma 3?

A:最簡單是用 MNN-LLM App(圖形介面);追求彈性可用 Termux + Ollama(命令列);想要最好的對話體驗可試 AnyChatAI。三種方式都完全免費,本教學都有詳細步驟。

Q:手機本地 AI 和雲端 AI(ChatGPT)比較,哪個比較好?

A:各有優勢。雲端 AI(ChatGPT、Claude)能力更強但需要付費訂閱且資料會上傳雲端;本地 AI(Gemma 3)免費、完全離線、資料不外洩,但能力相對較弱且速度受設備限制。建議兩者搭配使用:日常簡單任務用本地,複雜任務用雲端。

還想體驗更多開源大模型?
Gemma 3 / Phi-4 / MiniCPM / Qwen3.5 一站下載
查看全部模型 →

VPN07 — 手機下載 AI 模型加速首選

千兆頻寬加速 · 70+ 國家節點 · 十年穩定運營

手機下載 Gemma 3 模型慢得要命?VPN07 提供 1000Mbps 千兆頻寬,讓 Gemma 3 4B(2.8GB)在 WiFi 環境 30 秒下載完成。70+ 國家節點、穩定運營十年、30 天退款保障,$1.5/月讓你的手機 AI 旅程從此飛快啟航。

$1.5/月
超低月費
1000Mbps
千兆頻寬
70+
國家節點
30天
退款保障

相關文章推薦

月費$1.5 · 運營十年
免費試用 VPN07