ターミナルからWebを直接操作する新時代。本記事ではPowerShell上のGemini CLIに、Microsoft LearnとPlaywrightのMCP Serverを設定し、AIとの対話だけで、公式ドキュメント検索から実際のブラウザ操作までを完結させる方法を解説します。
「このサイトのタイトルだけ知りたい」「あのページの特定の情報だけ抜き出したい」——そんな定型的なWebブラウジング作業、未だに手動で行っていませんか?
この記事では、あなたのPowerShellを、対話だけでWebを操作できるAIエージェントへと進化させる方法を解説します。Googleの「Gemini CLI」をクライアントとし、その設定ファイルに2つの専門知識源(MCP Server)を登録。これにより、ターミナルから一歩も出ずに、以下を実現します。
- Microsoft Learnの専門家に、Windows ServerのEOLについて質問する。
- Playwrightの専門家に、実際のWebサイトをブラウジングしてもらう。
Node.Jsが事前に導入されていること
node.jsが導入されていない場合、以下のサイトから導入し、バージョン等確認しておく。
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32> node -v
v22.19.0
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32> npm -v
10.9.3
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32> npx -v
10.9.3
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
PS C:\WINDOWS\system32>
Gemini CLI + MCP: PowerShellを知の拠点兼ブラウザにする技術
こちらのページを参考に作業を進める。
このワークフローの核となるのが、Gemini CLIがMCP (Model Context Protocol) クライアントとして機能する点です。
- Gemini CLI: PowerShell上で動作し、ユーザーとの対話、コマンド実行、そしてWebブラウジングまで代行するAIエージェント。
- MCP Server: Gemini CLIに対して専門的な知識や能力(コンテキスト)を提供するバックエンド。
今回は、Gemini CLIに以下の2つのMCP Serverを認識させ、質問に応じて適切な専門家が応答するように設定します。
- Microsoft Learn MCP Server: Microsoft公式ドキュメントの専門家
- Playwright MCP Server: Webブラウザ操作の専門家
セットアップ手順: PowerShellからすべてを完結
Step 1: Gemini CLIのインストールと認証
npmで導入後、Gemini 2.5 Proを指定して、起動。
→まず、主役となるGemini CLIをPowerShellに導入します。
PS C:\WINDOWS\system32> npm install -g @google/gemini-cli
added 468 packages in 36s
145 packages are looking for funding
run `npm fund` for details
PS C:\WINDOWS\system32>
→Geminie2.5Proを指定して起動します
PS C:\WINDOWS\system32> gemini -m gemini-2.5-pro
███ █████████ ██████████ ██████ ██████ █████ ██████ █████ █████
░░░███ ███░░░░░███░░███░░░░░█░░██████ ██████ ░░███ ░░██████ ░░███ ░░███
░░░███ ███ ░░░ ░███ █ ░ ░███░█████░███ ░███ ░███░███ ░███ ░███
░░░███ ░███ ░██████ ░███░░███ ░███ ░███ ░███░░███░███ ░███
███░ ░███ █████ ░███░░█ ░███ ░░░ ░███ ░███ ░███ ░░██████ ░███
███░ ░░███ ░░███ ░███ ░ █ ░███ ░███ ░███ ░███ ░░█████ ░███
███░ ░░█████████ ██████████ █████ █████ █████ █████ ░░█████ █████
░░░ ░░░░░░░░░ ░░░░░░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░
Tips for getting started:
1. Ask questions, edit files, or run commands.
2. Be specific for the best results.
3. Create GEMINI.md files to customize your interactions with Gemini.
4. /help for more information.
╭──────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ │
│ ⠋ Waiting for auth... (Press ESC or CTRL+C to cancel) │
│ │
╰──────────────────────────────────────────────────────────────────────────────────────────────────────────╯
███ █████████ ██████████ ██████ ██████ █████ ██████ █████ █████
░░░███ ███░░░░░███░░███░░░░░█░░██████ ██████ ░░███ ░░██████ ░░███ ░░███
░░░███ ███ ░░░ ░███ █ ░ ░███░█████░███ ░███ ░███░███ ░███ ░███
░░░███ ░███ ░██████ ░███░░███ ░███ ░███ ░███░░███░███ ░███
███░ ░███ █████ ░███░░█ ░███ ░░░ ░███ ░███ ░███ ░░██████ ░███
███░ ░░███ ░░███ ░███ ░ █ ░███ ░███ ░███ ░███ ░░█████ ░███
███░ ░░█████████ ██████████ █████ █████ █████ █████ ░░█████ █████
░░░ ░░░░░░░░░ ░░░░░░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░ ░░░░░
Tips for getting started:
1. Ask questions, edit files, or run commands.
2. Be specific for the best results.
3. Create GEMINI.md files to customize your interactions with Gemini.
4. /help for more information.
╭──────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ │
│ Get started │
│ │
│ How would you like to authenticate for this project? │
│ │
│ ● 1. Login with Google │
│ 2. Use Gemini API Key │
│ 3. Vertex AI │
│ │
│ No authentication method selected. │
│ │
│ (Use Enter to select) │
│ │
│ Terms of Services and Privacy Notice for Gemini CLI │
│ │
│ https://github.com/google-gemini/gemini-cli/blob/main/docs/tos-privacy.md │
│ │
╰──────────────────────────────────────────────────────────────────────────────────────────────────────────╯
→Googleのアカウントでログインします
Step 2: Gemini CLIの設定ファイルを探す
次に、MCP Serverの情報を書き込むためのGemini CLI自体の設定ファイルを探します。この作業もGeminiにやってもらいましょう。gemini
コマンドで対話モードに入り、質問します。
プロンプト例 (Gemini CLIに入力):
gemini cli自体の設定ファイルはどこにある?Windowsでのフルパスを教えて。
Geminiは、おそらく%APPDATA%
やユーザーのホームディレクトリ配下にある設定ファイルの場所(例: C:\Users\YourUser\.gemini\settings.json
)を教えてくれます。
╭─────────────────────────────────────────────────────────────────────────────╮
│ > gemini cli自体の設定ファイルはどこにある?Windowsでのフルパスを教えて。 │
╰─────────────────────────────────────────────────────────────────────────────╯
✦ Gemini CLIの構成ファイルは、通常、お使いのユーザーのホームディレクトリにある .gemini
という名前のフォルダに保存されます。
Windowsでのフルパスは以下の通りです。
C:\Users\<YourUsername>\.gemini
---
* <YourUsername> の部分をご自身の実際のユーザー名に置き換えてください。
Using: 1 MCP server (ctrl+t to view)
╭──────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ > Type your message or @path/to/file │
╰──────────────────────────────────────────────────────────────────────────────────────────────────────────╯
C:\WINDOWS\system32 no sandbox (see /docs) gemini-2.5-pro (99% context left)
Step 3: 設定ファイルに2つのMCP Serverを登録
いよいよ核心です。Step 2で見つけたGemini CLIの設定ファイル(settings.json
など)を開き、以下の内容を追記または編集します。
Microsoft Learn ...
: URLを指定してリモートのMCP Serverに接続します。playwright
: ローカルコマンド(npx
)を実行してMCP Serverを起動します。
{
"selectedAuthType": "oauth-personal",
"mcpServers": {
"Microsoft Learn MCP Server": {
"httpUrl": "https://learn.microsoft.com/api/mcp"
},
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
ファイルを保存すれば、Gemini CLIは二人の専門家の能力を手に入れました。設定内容がGemini CLIに反映されていることを確認できます。
╭──────────╮
│ > /mcp │
╰──────────╯
ℹConfigured MCP servers:
🟢 Microsoft Learn MCP Server - Ready (3 tools)
Tools:
- microsoft_code_sample_search
- microsoft_docs_fetch
- microsoft_docs_search
🟢 playwright - Ready (21 tools)
Tools:
- browser_click
- browser_close
- browser_console_messages
- browser_drag
- browser_evaluate
- browser_file_upload
- browser_fill_form
- browser_handle_dialog
- browser_hover
- browser_install
- browser_navigate
- browser_navigate_back
- browser_network_requests
- browser_press_key
- browser_resize
- browser_select_option
- browser_snapshot
- browser_tabs
- browser_take_screenshot
- browser_type
- browser_wait_for
💡 Tips:
• Use /mcp desc to show server and tool descriptions
• Use /mcp schema to show tool parameter schemas
• Use /mcp nodesc to hide descriptions
• Use /mcp auth <server-name> to authenticate with OAuth-enabled servers
• Press Ctrl+T to toggle tool descriptions on/off
╭─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ You are running Gemini CLI in your home directory. It is recommended to run in a project-specific directory. │
╰─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯
Using: 2 MCP servers (ctrl+t to view)
╭─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ > Type your message or @path/to/file │
╰─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯
~ no sandbox (see /docs) gemini-2.5-pro (100% context left)
実践!専門家を宿したPowerShellの実力
それでは、専門知識をインプットしたGemini CLIの実力をPowerShell上で試してみましょう。gemini
で対話モードに入り、質問します。
サンプル1: Microsoft Learnの専門家にドキュメントを問い合わせる
Azureに関する、正確性が求められる質問を投げかけます。
PowerShellでのGeminiへの質問:
Windows ServerのEOL一覧を教えて
Geminiは、Microsoft Learn MCP Serverに問い合わせ、公式ドキュメントに基づいた信頼性の高い回答をPowerShell上に直接表示します。
✦ はい、承知いたしました。Windows Serverの各バージョンのサポート終了日(EOL)の一覧です。
| バージョン | メインストリーム サポート終了日 | 延長サポート終了日 |
| :--- | :--- | :--- |
| Windows Server 2025 | 2029年11月13日 | 2034年11月14日 |
| Windows Server 2022 | 2026年10月13日 | 2031年10月14日 |
| Windows Server 2019 | 終了済み | 2029年1月9日 |
| Windows Server 2016 | 終了済み | 2027年1月12日 |
| Windows Server 2012 R2 | 終了済み | 2023年10月10日 |
| Windows Server 2012 | 終了済み | 2023年10月10日 |
補足:
* メインストリームサポート: 機能更新プログラムの提供、仕様変更、新機能のリクエストなどが受けられる期間です。
最新の情報は、Microsoft公式のライフサイクルに関するページ
(https://learn.microsoft.com/ja-jp/windows/release-health/windows-server-release-info)でご確認ください。
サンプル2: Playwrightの専門家にブラウザ操作を依頼する
続けて、同じセッションで今度は実際のWebブラウジングを依頼します。
PowerShellでのGeminiへの質問:
playwrightを使って、Googleのトップページにアクセスして、そのページのタイトルを教えて。
この指示を受け、GeminiはPlaywright MCP Serverを起動します。すると、バックグラウンドでPlaywrightがブラウザを立ち上げてgoogle.com
にアクセスし、タイトル情報を取得。その結果をPowerShell上に返してくれます。
╭────────────────────────────────────────────────────────────────────────────────────────────╮
│ > playwrightを使って、Googleのトップページにアクセスして、そのページのタイトルを教えて。 │
╰────────────────────────────────────────────────────────────────────────────────────────────╯
╭─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
│ ✓ browser_navigate (playwright MCP Server) {"url":"https://www.google.com"} │
│ │
│ 諸々、省略 │
╰─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯
✦ Googleのトップページのタイトルは「Google」です。
これでコーディングすることなく、自然言語で指示するだけでWeb上の情報を手に入れることができるのです。
まとめ: ターミナルが情報収集と実行の司令塔になる
今回は、PowerShell上で動作するGemini CLIに、Microsoft LearnとPlaywrightという2つのMCP Serverを直接設定する方法をご紹介しました。
これにより、あなたのPowerShellは単なるコマンド実行環境から、
- 信頼性の高いドキュメントをAIに問い合わせる「知の拠点」
- WebブラウジングをAIに代行させる「自動化の司令塔」
へと進化します。この強力なカスタマイズで、日々の情報収集や定型作業を劇的に効率化してみてください。