AndroidでQwen3.5を動かす!Termux・APK完全インストールガイド
この記事について:AndroidスマートフォンでQwen3.5を完全ローカル実行したいですか?2026年3月2日にリリースされた小型モデルシリーズ(0.8B・2B・4B・9B)は、Samsung Galaxy・Google PixelなどのハイエンドAndroid端末で動作します。本記事ではTermux経由・ONNX Runtimeアプリ・MLC LLMの3つの方法を詳細に解説します。どの方法もインターネット接続なしでQwen3.5を完全無料で使えます。
対応Android端末と必要スペック
Qwen3.5をAndroidで動かすための最低要件はRAM 4GB以上・Android 10以降・ストレージ空き 8GB以上です。Snapdragon 888以降またはDimensity 9000以降のSoCを搭載した端末で最適なパフォーマンスが得られます。
おすすめAndroid端末とQwen3.5の組み合わせ
| 端末例 | RAM | 推奨モデル | 速度目安 |
|---|---|---|---|
| Galaxy S25 Ultra / S24 Ultra | 12GB | Qwen3.5-4B/9B | 15-25tok/s |
| Pixel 9 Pro / Pixel 9 | 16GB | Qwen3.5-4B | 12-20tok/s |
| Xiaomi 14 / OPPO Find X8 | 12GB | Qwen3.5-4B | 10-18tok/s |
| Galaxy S23 / Pixel 8 | 8GB | Qwen3.5-2B | 8-12tok/s |
| RAM 4-6GB Android端末 | 4-6GB | Qwen3.5-0.8B | 5-8tok/s |
方法1:Termux + Ollamaで実行(最も柔軟)
TermuxはAndroid上でLinux環境を動かせる強力なターミナルアプリです。F-Droidから無料でダウンロードでき、Ollamaをインストールすることでパソコン並みの柔軟性でQwen3.5を実行できます。
重要:TermuxはGoogle PlayではなくF-Droid(https://f-droid.org/packages/com.termux/)からダウンロードしてください。Google Play版は古く動作しない場合があります。
1 Termuxのインストールと初期設定
F-DroidからTermuxをインストール後、以下のコマンドを実行して環境を初期化します。
# パッケージリストを更新
pkg update && pkg upgrade
# 必要なツールをインストール
pkg install curl wget git nodejs-lts
# ストレージアクセスを許可
termux-setup-storage
2 Ollamaのインストール
Termux内でOllamaをインストールします。ARM64アーキテクチャ(Android端末)向けのバイナリが自動的にダウンロードされます。
# Ollamaのインストールスクリプトを実行
curl -fsSL https://ollama.com/install.sh | sh
# インストール確認
ollama --version
3 Qwen3.5モデルのダウンロードと実行
端末のRAMに合わせてモデルサイズを選択してください。
# RAM 4-6GBの端末 → 0.8Bモデル
ollama pull qwen3.5:0.8b
ollama run qwen3.5:0.8b
# RAM 6-8GBの端末 → 2Bモデル(推奨)
ollama pull qwen3.5:2b
ollama run qwen3.5:2b
# RAM 8GB+の端末 → 4Bモデル(高品質)
ollama pull qwen3.5:4b
ollama run qwen3.5:4b
4 Open WebUIでブラウザから操作(オプション)
コマンドライン以外でもChatGPTのような見た目のUIでQwen3.5を使いたい場合、Docker不要のOpen WebUIを使えます。
# Node.jsベースのシンプルなフロントエンド起動
npm install -g open-webui
open-webui serve
# Androidのブラウザで http://localhost:3000 を開く
方法2:qwen-code-termux(コーディングAI特化)
コード生成・デバッグに特化したqwen-code-termuxは、TermuxのPTY問題を解決したAndroid最適化版のQwen Codeエージェントです。Node.js 20+が必要で、インタラクティブなコーディング作業をAndroidから実行できます。
# Node.jsのインストール(Termux内)
pkg install nodejs-lts
# qwen-code-termuxのインストール
npm install -g @mmmbuto/qwen-code-termux@latest
# Qwen APIキーを設定(Alibaba Cloud Dashscopeから取得)
export DASHSCOPE_API_KEY="your_api_key_here"
# 起動!
qwen-code
qwen-code-termuxはQwen3.5-Coder APIを使用します。Alibaba Cloud Dashscopeで無料枠を取得できます。
方法3:ONNX Runtime(最も軽量・安定)
ONNX Runtimeを使ったオンデバイス推論は、消費電力が少なく古いAndroid端末でも安定動作します。Hugging FaceからプリコンパイルされたONNXモデルをダウンロードして使います。
1 local-llms-on-androidアプリをインストール
GitHubの「local-llms-on-android」プロジェクトからAPKをダウンロードします。ONNXベースのため、TermuxやNode.jsは不要です。
GitHub: github.com/dineshsoudagar/local-llms-on-android
必要要件:RAM 4GB+ | Android 10+ | ストレージ 3GB+
2 Qwen3.5 ONNXモデルのダウンロード
アプリ内からQwen3.5-0.8BまたはQwen3.5-2BのONNXモデルを直接ダウンロードできます。Q4量子化済みで、ファイルサイズは以下の通りです:
3 主な機能:ストリーミング応答・思考モード・マルチターン会話
3つの方法を比較:どれを選ぶべきか
Android Qwen3.5実行方法 比較表
| 方法 | 難易度 | 対応モデル | 特徴 |
|---|---|---|---|
| Termux + Ollama | ★★★☆☆ | 0.8B〜9B | 最も柔軟・全モデル対応 |
| qwen-code-termux | ★★☆☆☆ | Coderモデル | コーディング特化・高精度 |
| ONNX Runtime | ★☆☆☆☆ | 0.8B・2B | 最も簡単・低消費電力 |
Androidでの動作を高速化する設定
⚡ パフォーマンス最大化の設定
- • パフォーマンスモード:Android設定 → バッテリー → パフォーマンスモードをON
- • 開発者オプション:「バックグラウンドプロセスの上限」を「標準制限」に設定
- • SWAP設定:Termuxで swap を有効化(RAM 4GB端末のみ)
- • 充電しながら使用:熱による性能制限を避けるため充電ケーブルを接続
🔧 Ollamaのメモリ最適化
# コンテキスト長を短くしてメモリ節約
ollama run qwen3.5:2b --context-length 2048
# GPU層数を調整(数値を増やすほど速い)
OLLAMA_NUM_GPU=999 ollama run qwen3.5:2b
AndroidローカルQwen3.5の活用シーン
モバイルコーディング
qwen-code-termuxを使えば、AndroidスマートフォンからGitHubのコードを編集・デバッグできます。外出先でのホットフィックスに最適です。
文書作成・翻訳
日本語・英語・中国語間の高品質な翻訳をオフラインで実行。ビジネスメール・契約書・技術文書の作成補助にも活用できます。
勉強・知識整理
教科書の内容を説明させる・複雑な概念を簡単に解説・暗記カードを生成するなど、学習サポートをインターネット不要で行えます。
プライベートアシスタント
日記・健康記録・財務メモなど個人情報を完全にローカルで処理。データが一切外部に出ないプライバシー重視のAIアシスタントとして機能します。
よくあるエラーと対処法
🔴 「not enough memory」エラー
→ より小さいモデル(2B→0.8B)に変更。または他のアプリをすべて終了してRAMを解放してください。SWAPの有効化も有効です。
🔴 Termuxのインストールが失敗する
→ Google PlayのTermuxは古いバージョンのため使用禁止。F-Droidから最新版をインストールしてください。
🔴 Ollamaのダウンロードが遅い・失敗する
→ Wi-Fi環境で再試行するか、VPN07を使用して安定した高速接続を確保してください。モデルファイルは数GBあるため、安定した回線が必要です。
🔴 応答が途中で止まる・文字化けする
→ コンテキスト長を短く設定(--context-length 1024)するか、量子化レベルをQ4に変更してください。日本語テキストはUTF-8エンコーディングを確認してください。
Androidでのバッテリー消費とサーマルスロットリング対策
AndroidでQwen3.5を長時間実行すると、デバイスの発熱によりCPU/GPUが自動的に速度を落とす「サーマルスロットリング」が発生します。これを防ぐための対策をご紹介します。
🌡️ 発熱対策
- • クーラーケースや冷却ファンの使用(長時間作業時)
- • 直射日光・高温環境での使用を避ける
- • 充電しながらの高負荷作業は特に発熱しやすい
- • 連続30分以上の推論後は5分程度休止することを推奨
⚡ バッテリー節約設定(Ollama)
# スレッド数を制限してバッテリー消費を削減
OLLAMA_NUM_THREAD=4 ollama run qwen3.5:2b
# GPUレイヤーを減らしてCPUメインで動作
OLLAMA_NUM_GPU=0 ollama run qwen3.5:2b
日本語での精度を上げるプロンプト設定
Qwen3.5は201言語対応ですが、プロンプトに明示的な指示を加えることで日本語の回答品質をさらに向上させることができます。
🗾 日本語最適化プロンプト例
# Ollamaでシステムプロンプトを設定する方法
ollama run qwen3.5:4b
# チャット内でシステムプロンプトを設定:
/set system あなたは日本語を母国語とするAIアシスタントです。
自然な日本語で丁寧に回答してください。
専門用語は必要に応じて説明を加えてください。
# これ以降の回答が日本語優先になる
💡 より良い日本語回答を得るコツ
- • 質問は明確・具体的に(曖昧な質問は曖昧な回答になりやすい)
- • 「〇〇文字程度で」「箇条書きで」など出力形式を指定する
- • 専門分野は「〇〇の専門家として」と役割を設定する
- • 長文生成時は「続けて」「次のパートを書いて」で分割生成する
Androidローカルの企業・個人ユースケースまとめ
AndroidでQwen3.5をローカル実行することで得られる最大のメリットはプライバシーの完全保護です。以下の職種・シーンで特に有効活用できます。
まとめ:Androidでもローカルの強力なAIが使える時代に
Qwen3.5の小型モデルシリーズのリリースにより、Androidスマートフォンは本格的なAIプラットフォームになりました。月額費用ゼロ・完全オフライン・プライバシー完全保護のローカルAIを、今すぐ実現できます。
初心者にはONNX Runtimeアプリ、柔軟性を求めるならTermux + Ollama、コーディング特化ならqwen-code-termuxをお勧めします。モデルのダウンロードや海外APIへのアクセスには、VPN07の高速回線を活用してください。
VPN07:モデルDLを1000Mbpsで高速化
10年以上の実績・IEPL専用回線・70か国以上
Qwen3.5モデルファイル(数GB)の高速ダウンロードに、VPN07の1000Mbps超高速IEPL回線を活用してください。Hugging Face・ModelScope・Ollamaライブラリへの安定アクセスを実現します。月額$1.5・30日間返金保証・Android公式アプリ対応。