🔌 MCP Servers

mcp-video-understanding

> Gemini APIを活用したビデオ理解機能を提供するModel Context Protocol (MCP) サーバー

❤️ 0
⬇️ 0
👁 1
Share

Description

🎥 MCP Video Understanding

Gemini APIを活用したビデオ理解機能を提供するModel Context Protocol (MCP) サーバー

npm version

概要

このプロジェクトは、Gemini APIのマルチモーダル機能を活用し、動画の理解・分析を行うMCPサーバーです。ローカルまたはリモートの動画を分析し、内容を詳細に要約できます。

主な機能

ビデオからの意味理解 - 音声と映像を統合的に分析 🎯 マルチモーダル分析 - Geminiの高度なAI機能を活用 🔧 柔軟な設定 - カスタムプロンプトとモデル選択が可能

前提条件

  • Node.js v18以上
  • npm
  • Google Cloud の Gemini API キー

API キーの設定

MCP クライアント(Claude Desktop等)で使用する場合

Claude Desktop の設定ファイル(後述)で env にAPIキーを指定するか、システムの環境変数を使用してください。

ローカル開発・テスト時

プロジェクトルートに .env ファイルを作成すると便利です:

# .env.example をコピーして使用
cp .env.example .env

# .env ファイルを編集してAPIキーを設定
# GOOGLE_API_KEY=your_api_key_here

.env ファイルの例:

GOOGLE_API_KEY=your_api_key_here

# オプション: 使用するモデルを指定
GEMINI_MODEL=gemini-2.5-flash

注意: .env ファイルはローカル開発・テスト実行時のみ読み込まれます。MCPサーバーとして動作する場合は別途設定が必要です。

システム環境変数での設定

macOS / Linux

~/.zshrc または ~/.bashrc にAPIキーを設定してください:

export GOOGLE_API_KEY="your_api_key_here"

サーバーは自動的に ~/.zshrc からキーを読み取ります。

Windows

コマンドプロンプト (cmd) の場合:

一時的な設定(現在のセッションのみ有効):

set GOOGLE_API_KEY=your_api_key_here

永続的な設定:

setx GOOGLE_API_KEY "your_api_key_here"

PowerShell の場合:

一時的な設定(現在のセッションのみ有効):

$env:GOOGLE_API_KEY="your_api_key_here"

永続的な設定:

[System.Environment]::SetEnvironmentVariable('GOOGLE_API_KEY', 'your_api_key_here', 'User')

注意: 永続的な設定後は、新しいターミナルウィンドウを開いて設定を反映してください。

MCP クライアントの設定(Claude Desktopの場合)

設定ファイルの場所

macOS:

~/Library/Application Support/Claude/claude_desktop_config.json

Windows:

%APPDATA%\Claude\claude_desktop_config.json

設定内容

基本設定 (macOS / WSL含むLinux):

Claude Desktop などのMCPクライアントで使用する場合、設定ファイルに以下を追加:

{
  "mcpServers": {
    "gemini-video": {
      "command": "npx",
      "args": ["mcp-video-understanding"],
      "env": {
        "GOOGLE_API_KEY": "your_api_key_here"
      }
    }
  }
}

Windows (cmd経由で実行する場合):

{
  "mcpServers": {
    "gemini-video": {
      "command": "cmd",
      "args": ["/c", "npx", "mcp-video-understanding"],
      "env": {
        "GOOGLE_API_KEY": "your_api_key_here"
      }
    }
  }
}

注意: /c オプションは「コマンドを実行して終了」を意味します。

セキュリティ重視の設定:

APIキーを設定ファイルに直接書きたくない場合は、env を空にしてシェル環境変数を使用:

{
  "mcpServers": {
    "gemini-video": {
      "command": "npx",
      "args": ["mcp-video-understanding"],
      "env": {}
    }
  }
}

npx のパス確認方法

macOS / Linux:

which npx
  • 一般的: /usr/local/bin/npx
  • Apple Silicon (Homebrew): /opt/homebrew/bin/npx
  • mise使用時: /Users/your-username/.local/share/mise/shims/npx

Windows:

where.exe npx
  • 一般的: C:\Program Files\nodejs\npx.cmd
  • npm グローバルインストール: C:\Users\your-username\AppData\Roaming\npm\npx.cmd

注意: 環境によっては npx のフルパスが必要です。上記のコマンドで確認してください。

セットアップ

インストール

# リポジトリをクローン
git clone https://github.com/shin902/mcp-video-understanding.git
cd mcp-video-understanding

# 依存関係をインストール
npm install

# ビルド
npm run build

使用方法

利用可能なツール

📹 analyzeLocalVideo

ローカルの動画ファイルを分析します。

デフォルトプロンプト:

最初にこの記事全体を要約し全体像を掴んだ後、大きなセクションごとに細かく要約を行ってください。
その次に小さなセクションごとに更に詳細な要約を行ってください。

カスタムプロンプトを指定することも可能です。

🌐 analyzeRemoteVideo

公開URLの動画を分析します。使用方法は analyzeLocalVideo と同様です。

YouTube動画の制限:

  • ❌ 非公開動画
  • ❌ 限定公開動画
  • ❌ 配信のアーカイブ
  • ✅ 完全に公開されている動画のみ対応

対応する動画形式

Geminiのマルチモーダル動画理解により、以下の形式に対応:

  • 🎤 音声付き解説動画 - 講義、チュートリアルなど
  • 🎬 音声なし動画 - 映像のみのコンテンツ
  • 🎵 Music Video - 映像がメインの動画

使用モデル

モデル 特徴
gemini-2.5-flash (デフォルト) 高速かつバランスの取れた性能
gemini-2.5-pro より高度な分析が可能
gemini-2.5-flash-lite 軽量で高速

開発

1. MCP Inspector を使った開発

公式のデバッグツール「MCP Inspector」を使うと、サーバーの動作をリアルタイムで確認できます:

# ビルド後に Inspector を起動
npm run build
npx @modelcontextprotocol/inspector node build/index.js

ブラウザ上でツールの呼び出しやレスポンスを確認しながら開発できます。

2. ローカルパスでの開発設定

Claude Desktop の設定で、npx ではなくローカルのビルド済みファイルを直接指定:

macOS / Linux:

{
  "mcpServers": {
    "gemini-video": {
      "command": "node",
      "args": ["/absolute/path/to/mcp-video-understanding/build/index.js"],
      "env": {
        "GOOGLE_API_KEY": "your_api_key_here"
      }
    }
  }
}

Windows:

{
  "mcpServers": {
    "gemini-video": {
      "command": "cmd",
      "args": ["/c", "node", "C:\\absolute\\path\\to\\mcp-video-understanding\\build\\index.js"],
      "env": {
        "GOOGLE_API_KEY": "your_api_key_here"
      }
    }
  }
}

3. Watch モードでの開発

TypeScript を自動コンパイルしながら開発:

# Watch モードで起動(ファイル変更を自動検知してビルド)
tsc --watch

別のターミナルで Claude Desktop を再起動して変更を反映します。

その他の開発コマンド

# テスト実行
npm test

# ビルド
npm run build

ビルドされたファイルは build/ ディレクトリに出力されます。

コントリビューション

プルリクエストは歓迎します!大きな変更を行う前に、まずissueで議論してください。

ライセンス

MIT

Reviews (0)

Sign in to write a review.

No reviews yet. Be the first to review!

Comments (0)

Sign in to join the discussion.

No comments yet. Be the first to share your thoughts!

Compatible Platforms

Pricing

Free

Related Configs