OpenClaw リモートコントロール完全ガイド:スマホを個人 AI OS のリモコンに変える
カフェにいるとき、自宅デスクトップ PC 上の PDF を急いで確認する必要が出ました。スマホを取り出し、Telegram の「ClawBot」に「デスクトップのスクリーンショットを見せて」と送信。10 秒後に届いた画像で PDF を確認し、「このファイルを開いて 3 ページ目の内容を教えて」と送ると、2 分後に要約が返ってきました。
正直、この半年こうした使い方は日常になりました。OpenClaw を個人 AI オペレーティングシステムとして構築してから、iPhone は本物の「リモコン」です。自宅 PC のカメラ起動、位置情報取得、リモートスクリーンショット——すべてオープンソースで、データは完全に自分の手元にあります。
メーカー機能の枠を超え、スマホを AI エージェントの操作盤にしたいなら、このOpenClaw リモートコントロールガイドはまさにあなた向けです。概念は抜きにして、すぐ実践に入りましょう。
低コスト「エビ飼育」ガイド:ArkClaw で AI Agent を本当に身近に
最近話題の OpenClaw(エビ)は便利ですが、設定のハードルが高い。ByteDance 火山引擎の ArkClaw はその敷居を一気に下げました。サーバーや Token 設定をいじらず、ワンクリックで 24 時間オンライン、ブラウザ操作・スクリプト実行・カレンダー管理ができる「AI 下請け」を手に入れられます。
何より安い:月額わずか 9.9 元。招待コード ZLKUK54M(こちらから登録)を使えば 8.9 元。プログラマーなら Coding Plan Pro に入ると無料で使える特典もあります。
OpenClaw ゲートウェイプロトコルの理解(Layer 1 基礎)
スマホを OpenClaw のリモコンにするには、まず仕組みを押さえます。「ゲートウェイプロトコル」という言葉に圧倒されないでください。異なるデバイスが互いを認識するための「合言葉」のセットです。
OpenClaw は Gateway WS Protocol(ゲートウェイ WebSocket プロトコル)を使います。名前は仰々しいですが、原理はシンプルです。PC のメイン制御端、スマホのノード、Telegram のチャット UI——すべてのデバイスが WebSocket 長接続で統一コントロールプレーンに接続し、接続時に「身元」と「能力」を報告します。
例えば iPhone は「iOS ノード。カメラ・スクリーンショット・位置情報が使える」と宣言します。PC は「ゲートウェイ。調整役」と。Telegram Bot は「クライアント。ユーザー指令を受け取る」と。
3 つの核心ロールを理解すれば、以降の設定はスムーズです。
Gateway(ゲートウェイ):システムの「頭脳」。メイン端末(通常 PC やサーバー)で動き、すべての指令を受け取り各ノードへ振り分けます。
Node(ノード):タスクを実行する端末。iPhone、Android、旧スマホも登録可能。各ノードは caps(能力)を宣言します。例:camera(カメラ)、screen(スクリーンショット)、location(位置情報)、voice(音声)。
Client(クライアント):指令を送る UI。Telegram、Discord、専用 iOS App、Web UI など。
ここで「スマホにこんな権限を開放して安全なの?」と思うかもしれません。
率直に言うと、これが私の最初の懸念でした。OpenClaw は Token 認証、デバイス署名、TLS 暗号化に加え、きめ細かい権限制御を備えています。ノードが「カメラ能力あり」と宣言しても、ゲートウェイ側で「このクライアントはスクリーンショットのみ、カメラ不可」と制限できます。
[画像:OpenClaw ゲートウェイプロトコルアーキテクチャ図。Gateway・Node・Client の関係]
プロンプト:技術アーキテクチャ図, Gateway 中心ノードが複数の iOS/Android デバイスに接続, 青系テックスタイル, シンプルで明確, high quality
設定時、ノード接続パラメータに次の JSON が見えます。
{
"role": "node",
"caps": ["camera", "screen", "location"],
"commands": ["camera.snap", "screen.record", "location.get"],
"permissions": {
"camera.capture": true,
"screen.record": false
}
}
意味は明確です。このノードは撮影・スクリーンキャプチャ・位置取得が可能ですが、実際の利用可否はゲートウェイ権限次第。ノードが侵害されても、攻撃者の行動範囲は限定的です。
モバイルノード設定の実践(Layer 2 応用)
原理がわかったら手を動かします。iOS と Android で手順が大きく異なるため、分けて説明します。
iOS ノード設定
OpenClaw は App Store 未公開のため、TestFlight(内測資格があれば)か IPA 自己署名が必要です。私は AltStore で月 1 回再署名しており、大きな手間ではありません。
インストール後、ノード設定画面で次を正確に入力します。
Gateway URL:ゲートウェイの WebSocket アドレス。LAN テストなら ws://192.168.1.100:8080。外部アクセスはリバースプロキシで wss:// を使います。私は Cloudflare Tunnel で公開 IP を露出していません。
Client ID:ノード名。例:「iphone-15-main」。
Auth Token:ゲートウェイで生成した認証トークンを貼り付け。
Capabilities:開放する能力を選択。初回は location のみを推奨し、通ったら camera と screen を追加。最初から全開放すると障害切り分けが難しくなります。
接続後、緑の「Connected」が出ればノードはゲートウェイに登録完了です。
iOS の落とし穴はバックグラウンド制限です。バックグラウンド放置でプロセスが kill されることがあります。「バックグラウンド App 更新」の有効化か、時々アプリを開いて活性維持が必要です。私はサブ端末にノードを載せ、メイン端末は通常利用しています。
Android ノード設定
Android は柔軟です。公式 APK か Termux の Node 版を選べます。
APK は iOS と同様に、インストール→設定→接続。バックグラウンド制限は iOS より緩い一方、Huawei・Xiaomi・OPPO など国産 ROM は「バックグラウンド実行を許可」を手動設定しないと凍結されます。
Termux 案はカスタマイズ向き。Node.js を入れ npm install openclaw で CLI 起動。ログが詳細で障害調査に有利ですが、Termux:Boot や Tasker などの常駐対策が必要です。
[画像:Android Termux で OpenClaw ノード実行中のスクリーンショット]
プロンプト:スマホ画面, Termux ターミナルに OpenClaw ノード接続成功ログ, ダークモード, 緑文字, high quality
iOS/Android 共通の原則は最小権限です。位置情報とたまのスクリーンショットだけならカメラは不要。権限を絞るほど攻撃面は縮小します。
もう一点、デバイス署名。鍵ペアを生成し公開鍵をゲートウェイ、秘密鍵をノードに置けば、Token 漏洩だけでは接続できません。私のゲートウェイは署名を必須にしています。
Telegram リモートコントロール実践
ノード接続後、どう操作するか。最も直接的なのは Telegram です。追加 App 不要で、開くだけ使えるのが好みです。
@BotFather で Bot を作成し Token を取得。OpenClaw の channel 設定に Telegram プラグインを追加して Token を入力、ゲートウェイを再起動すれば Bot が稼働します。
channels:
telegram:
token: "YOUR_BOT_TOKEN"
mode: polling
Polling は個人利用向けで手軽。Webhook は公開 HTTPS が必要ですが応答は速いです。
Bot 接続後、OpenClaw はデフォルトでメッセージを AI に転送しますが、ここではハードウェアのリモート制御が目的なので、専用コマンド形式を使います。
skills 設定でノード能力にコマンドをバインドします。
skills:
remote_control:
commands:
camera:
target: "iphone-15-main"
action: "camera.snap"
screenshot:
target: "iphone-15-main"
action: "screen.capture"
where:
target: "iphone-15-main"
action: "location.get"
設定後、Telegram で /camera と送れば指定 iPhone が撮影して返信します。/where で GPS 座標が返ります。
初めて自宅スマホから写真が返ってきたとき、本当にワクワクしました。常時待機の助手が増えた感覚——しかも完全に自分のものです。
[画像:Telegram 対話。/camera コマンドと返信写真]
プロンプト:Telegram チャット画面, ユーザーが /camera 送信, Bot が撮影写真を返信, スマホ UI, 中国語, high quality
Telegram はグループにも対応。自分専用グループに Bot を入れると履歴管理が楽です。家族共有も可能ですが、権限設定は慎重に——夜中にスクリーンショットを撮られる経験は聞かないでください。
Telegram から Bot に画像やドキュメントを送ることもできます。自宅のサブ端末に画像を送り、OpenClaw に分析や保存をさせる——ある種の「クロスデバイスクリップボード」です。
専用 App と応用シナリオ
Telegram は便利ですが、チャット UI ゆえに不向きな場面もあります。自宅カメラを素早く確認したい、全ノード状態を一覧したい——その場合は専用 App が有効です。
OpenClaw 公式 Web UI はデフォルトで http://localhost:3000。スマホブラウザでダッシュボードを開けますが、外部アクセスにはリバースプロキシが必要です。
私は Nginx + HTTP Basic Auth で外部公開し、ブックマークして使っています。オンラインノード、能力ステータス、最新ログを確認でき、ノードをクリックして Camera ボタンで手動撮影も可能です。
コミュニティには ClawDash など第三方パネルもあり、レイアウトカスタマイズやホームに常用ボタン配置ができます。ただしゲートウェイ接続ツールなので、安全性は自己評価が必要です。
自動化ワークフロー
より高度な使い方:自動化。OpenClaw はイベントトリガーでスキル実行が可能です。
例:ジオフェンス。携帯ノードが「自宅」範囲に入ると、自宅 PC が「音楽プレイヤーを開く」を自動実行。帰宅時にはすでに音楽が流れています。
別例:定期スクリーンショット。サブ Android を毎朝 8 時にキャプチャさせ、AI が異常(家電の消し忘れなど)を検知したら Telegram で通知します。
設定ファイルの例:
automations:
- name: "arrive_home"
trigger:
type: "geofence"
device: "iphone-15-main"
location: "home"
action:
target: "macbook-pro"
skill: "music.play"
- name: "morning_check"
trigger:
type: "schedule"
cron: "0 8 * * *"
action:
target: "android-spare"
skill: "screen.analyze"
トラブルシューティング
設定中に踏みがちな落とし穴です。
ゲートウェイ接続不可:WebSocket アドレスとポートを確認。curl ws://gateway-ip:port でテスト。wss なら証明書を確認。
ノードオフラインだが App は接続済み:role が "client" になっていないか確認。正しくは "node" です。
コマンド無応答:ゲートウェイログでルーティング先を確認。デバイス ID 誤りで存在しないノードに送っていることがあります。
権限拒否:ノードの permissions とゲートウェイ権限ポリシーを確認。OpenClaw の権限は双方向で、ノード宣言とゲートウェイ許可の両方が必要です。
まとめ
要点は 3 つです。
第一、OpenClaw の Gateway Protocol は統一デバイス接続標準を提供し、スマホと PC を同一コントロールプレーンで対話させます。黒魔術ではなく、WebSocket とロール/能力宣言の仕組みです。
第二、スマホをノード化すれば、携行センサー兼実行端末を得ます。カメラ・位置・画面——スマホ専用だったハードウェアを AI エージェントから呼び出せます。
第三、Telegram や専用 App を UI にすれば、どこからでも自宅 AI に指令できます。データと決定権が完全に自分の手元にある点で、クラウド型スマートアシスタントより実用的です。
まだ試していないなら、今夜サブ端末を見つけ第 2 章の手順で設定してみてください。「リモート撮影」だけでも、どこからでも目を持つ感覚は新鮮です。
コミュニティは OpenClaw を継続改善し、新スキルと統合が増え続けています。今は Layer 2 のハードウェア制御ですが、将来はさらに広がるでしょう。
少なくとも今、私のスマホはスマホ以上の存在——AI OS のリモコンです。あなたのもそうなれます。
OpenClaw モバイルノード設定の完全手順
iOS または Android を OpenClaw ノードとして設定する詳細手順。ゲートウェイ接続、権限設定、Telegram Bot 制御を含む
⏱️ 目安時間: 30 分
- 1
ステップ1: 準備:OpenClaw ノードアプリのインストール
iOS ユーザー:
• TestFlight または AltStore で自己署名し、OpenClaw iOS クライアントをインストール
• ノードをオンライン維持するため「バックグラウンド App 更新」を有効化
Android ユーザー:
• 案 A:公式 APK をインストールし「バックグラウンド実行を許可」
• 案 B:Termux で npm install openclaw を実行
注意:サブ端末の方が長期ノード運用に向く。メイン端末はバックグラウンド制限の影響を受けやすい - 2
ステップ2: ノード接続パラメータの設定
主要フィールド:
• Gateway URL:ws://LAN IP:ポート または wss://公開ドメイン
• Client ID:一意 ID(例:"iphone-15-main")
• Auth Token:ゲートウェイで生成した認証トークン
• Capabilities:必要に応じて location/camera/screen を選択
セキュリティ推奨:
• デバイス鍵ペアを生成し、公開鍵をゲートウェイ、秘密鍵をノードに保管
• 初回は location のみ開放し、テスト後に他権限を追加
• 最小権限の原則で攻撃面を縮小 - 3
ステップ3: Telegram Bot 制御の設定
Bot 作成:
• Telegram で @BotFather に連絡し /newbot を実行
• 取得した Bot Token を保存
OpenClaw 設定:
• channels に telegram プラグインを追加
• mode は polling(個人利用)または webhook(高速応答)
• skills でコマンドをノード能力にバインド(例:/camera → camera.snap)
テストコマンド:
• /camera - リモート撮影
• /where - 位置情報取得
• /screenshot - 画面キャプチャ - 4
ステップ4: 応用:自動化ワークフローの設定
ジオフェンストリガー:
• 特定エリアへの進入/退出時にスキルを自動実行
• 例:帰宅時に音楽を自動再生
定期タスク:
• cron 式でスケジュール起動
• 例:毎朝 8 時にスクリーンショットで確認
トラブルシューティング:
• ゲートウェイ接続不可:WebSocket アドレスと TLS 証明書を確認
• ノードオフライン:role が "node" で "client" ではないか確認
• コマンド無応答:ゲートウェイログでルーティングを確認
FAQ
OpenClaw ノード設定に必要な技術レベルは?
• 基本的な CLI 操作
• WebSocket と Token 認証の概念理解
• yaml ファイルの編集
iOS ユーザーは TestFlight や自己署名インストールに慣れているとよいです。Android で Termux を使う場合は基本的な Linux コマンドが必要です。一般的な開発者なら 30 分以内で設定完了できます。
スマホをノードにするとバッテリー消費は激しい?
• location のみ:消費は極めて低く、ほぼ気にならない
• camera と screen:使用時のみ消費、平常時は影響小
• WebSocket 長接続:ハートビートの消費はごくわずか
推奨:サブ端末でノード常駐、または必要時のみ起動。iOS はバックグラウンド制限、Android は各社の省電力設定に注意。
OpenClaw リモート制御は安全?
• Token 認証:接続時に有効トークン必須
• デバイス署名:公開鍵/秘密鍵検証で Token 漏洩後のなりすましを防止
• TLS 暗号化:外部アクセスは wss で通信を暗号化
• 細粒度権限:ノードが能力を宣言し、ゲートウェイがクライアント呼び出しを制御
• ローカル展開:データは第三者サーバーを経由せず自己管理
ベストプラクティス:デバイス署名の強制 + 最小権限 + Token の定期更新。
Telegram Bot と専用 App、どちらが使いやすい?
Telegram Bot:
• メリット:追加 App 不要、どこでも使える、グループ共有可能
• デメリット:チャット UI は直感的でなく、複雑操作に不向き
専用 App / Web UI:
• メリット:ビジュアル UI、ワンクリック起動、ノード状態の確認が容易
• デメリット:外部アクセスにリバースプロキシが必要、追加 App の場合も
日常利用は Telegram Bot で十分。複雑・高頻度操作は Web UI を推奨。
スマホ以外に制御できるデバイスは?
• PC(macOS/Windows/Linux):メインゲートウェイまたは他ノード
• Raspberry Pi:低消費電力で長期稼働に最適
• Android TV / TV ボックス:自宅メディアセンターのリモコン
• 旧スマホ/タブレット:監視専用ノードに改造
制約は Node.js 実行または OpenClaw クライアントの存在と WebSocket 接続。コミュニティの発展で対応デバイスは増え続けます。
5分で読めます · 公開日: 2026年2月26日 · 更新日: 2026年6月8日
OpenClaw 導入と実践
検索からこのページに来た場合は、前後の記事もあわせて読むと同じテーマの理解がかなり早く深まります。
前の記事
API 請求書の不安を解消:モデルルーティングで OpenClaw コストを 80% 削減する方法
OpenClaw の 3 層モデルルーティング戦略を学び、単純なタスクを Claude の代わりにローカルの Llama 3 で処理することで、API コストを実測 70〜80% 削減。完全な設定チュートリアルと実際の請求書比較付き。
第 26 / 36 記事
次の記事
初心者から Pro へ:OpenClaw 初期設定において見落としてはならない5つのセキュリティスイッチ
OpenClaw のローカルゲートウェイ認証、Docker サンドボックス化、承認ゲートなど 5 つの重要セキュリティ設定を解説し、AI エージェント利用時のセキュリティ意識を身につけます。
第 28 / 36 記事
関連記事
OpenClaw 改名の全貌:Clawdbot から Moltbot、そして OpenClaw への変遷
OpenClaw 改名の全貌:Clawdbot から Moltbot、そして OpenClaw への変遷
OpenClaw 完全インストールガイド:環境準備から初回実行まで
OpenClaw 完全インストールガイド:環境準備から初回実行まで
OpenClaw クラウド vs ローカル:最適なデプロイの選び方
コメント
GitHubアカウントでログインしてコメントできます