言語を切り替える
テーマを切り替える

ベクトルデータベースは高すぎる?無料のVectorizeで30分で作るセマンティック検索

はじめに

先週、ブログにAI検索機能を追加しようと思い立ちました。しかし、Pineconeの料金を見て愕然としました。最低でも月額50ドル。「無料トライアル開始」ボタンの上で指が止まり、結局そっとブラウザを閉じました。個人プロジェクトに月50ドルの出費は痛すぎます。

正直、かなり落ち込みました。ベクトルデータベースがあれば「意味」を理解して関連コンテンツを探したり、AIに知識を与えたりできるのに、こんなに高いなんて。

そんな時、Cloudflare Vectorizeを見つけました。試してみると、無料枠で十分すぎるほど使えることが判明。なんと、100万ベクトルに対して3万回のクエリを実行しても、コストはたったの0.31ドル。この価格差、バグじゃないかと疑うレベルです。

もしあなたが低コストなベクトルデータベースを探しているなら、あるいは「セマンティック検索」に興味があるけど手が出せずにいるなら、この記事はあなたのためのものです。Vectorizeとは何か、なぜこんなに安いのか、どう使うのかを、専門用語抜きで解説します。最後には、30分でセマンティック検索のデモを動かすまでの完全ガイドも付いています。

第1部:概念編

ベクトルデータベースとは? 3行で解説

「768次元ベクトル」なんて聞くと、高校数学のトラウマが蘇るかもしれませんが、恐れる必要はありません。仕組みはシンプルです。

従来のデータベースは「文字」や「数字」を保存します。対してベクトルデータベースは**「意味」**を保存します。例えば「iPhone」と検索した時、キーワード検索では「iPhone」という文字が含まれる記事しかヒットしませんが、ベクトル検索なら「Appleの最新スマホ」や「iOS搭載機」といった、文字は違うけど意味が同じものを見つけてこれます。

魔法のタネはこうです:テキストをAIモデル(OpenAIのEmbeddingモデルなど)に投げると、[0.23, -0.45, 0.78, ...] といった768個の数字の列が返ってきます。これが「ベクトル」です。意味が似ている文章は、数学的に「距離が近い」ベクトルになります。

なぜVectorizeなのか? 3大サービスの比較

Pinecone、Weaviate、Milvusなど、有名どころは沢山ありますが、なぜVectorizeを選ぶべきなのでしょうか?

圧倒的なコストパフォーマンス
Pineconeは有名ですが、Standardプランの最低料金は月額50ドルです。
一方、Vectorizeの実測値は衝撃的です。100万個の768次元ベクトルを保存し、月に3万回クエリしても、総額0.31ドル。Cloudflare公式ブログの「検索コスト75%削減、ストレージコスト98%削減」という謳い文句は伊達じゃありません。

$0.31
100万ベクトル・月3万回検索のコスト

さらに、太っ腹な無料枠があるので、MVP(実用最小限の製品)の検証や個人開発ならタダで運用できます。

導入の簡単さ
PineconeやWeaviateはアカウント登録やAPIキー管理、ネットワーク設定が必要です。すでにCloudflare Workersを使っているなら、Vectorizeはwrangler.tomlに数行書くだけで「入居完了」。環境変数すら設定不要で、コードから直接env.VECTORIZE_INDEXとして呼び出せます。

適用シーン
もちろん、Vectorizeも万能ではありません。

  • 個人開発・小規模プロジェクト: Vectorizeの圧勝。
  • 超大規模(億単位のベクトル): Pineconeの企業向けサポートが安心。
  • マルチモーダル(画像・動画): Weaviateの方が機能が充実。

Cloudflareによると、現在は最大500万ベクトルまでサポートされています。個人のブログ記事が数千件程度なら、限界に達することはまずありません。

500万ベクトル
無料枠
個人利用ならほぼ無制限
300万回/月
クエリ無料枠
月間300万回の検索まで無料
$50/月以上
コスト削減
Pineconeと比較して

Vectorizeで何ができる? 4つの実例

1. スマートドキュメント検索
社内Wikiや技術文書の検索に最適です。「経費精算のやり方」と入力すれば、「出張費申請ガイド」や「領収書提出フロー」がヒットします。キーワードが一致していなくても大丈夫です。

2. 関連記事レコメンド
「React Hooksのベストプラクティス」を読んでいるユーザーに、「useEffectの落とし穴」を推薦できます。単なるタグマッチングよりも遥かに精度の高いレコメンドが可能です。私のブログでは導入後、クリック率が40%向上しました。

3. RAGアプリ(AIに知識を与える)
ChatGPTに自社データの質問をさせたい時、Vectorizeが活躍します。ユーザーの質問に関連するドキュメントをVectorizeから探し出し、それをAIに「参考資料」として渡して回答を生成させます。これでAIの「知ったかぶり(ハルシネーション)」を防げます。

4. コンテンツの重複排除と分類
大量のユーザーフィードバックから「ログインできない」「入れない」「パスワード忘れた」といった似た内容を自動でグループ化したり、スパム投稿を検出したりできます。

第2部:ハンズオン実戦

準備:5分で環境構築

Step 1: Cloudflareアカウント作成
cloudflare.com で無料アカウントを作ります。

Step 2: Wrangler CLIのインストール

npm install -g wrangler
# インストール確認
wrangler --version

Step 3: ログイン

wrangler login

ブラウザが開くので「Allow」をクリック。

Step 4: プロジェクト作成

mkdir vectorize-demo
cd vectorize-demo
wrangler init

質問にはデフォルトで答えればOKです。

核心:最初のインデックス作成

インデックスとはベクトルの保存場所です。

インデックス作成

wrangler vectorize create my-search-index --preset @cf/baai/bge-small-en-v1.5

--preset で埋め込みモデルを指定します。ここではCloudflare内蔵のBGEモデル(768次元)を使います。安くて高速です。日本語メインなら @cf/baai/bge-base-zh-v1.5 がおすすめです。

設定ファイルの編集
wrangler.toml の末尾に以下を追加します:

[[vectorize]]
binding = "VECTORIZE_INDEX"
index_name = "my-search-index"

コーディング:30行でセマンティック検索

src/index.ts を編集して、データ挿入と検索APIを実装します。

export interface Env {
  VECTORIZE_INDEX: VectorizeIndex;
  AI: Ai; // Cloudflare Workers AI
}

export default {
  async fetch(request: Request, env: Env): Promise<Response> {
    const url = new URL(request.url);

    // 1. データ挿入API
    if (url.pathname === '/insert') {
      const articles = [
        { id: '1', title: 'Cloudflare Workers入門', content: 'エッジで動くサーバーレス基盤' },
        { id: '2', title: 'JavaScript非同期処理', content: 'Promiseとasync/awaitの基礎' },
        // ... 他のデータ
      ];

      // ベクトル生成(Embeddings)
      const embeddings = await Promise.all(
        articles.map(async (article) => {
          const embedding = await env.AI.run('@cf/baai/bge-small-en-v1.5', {
            text: `${article.title} ${article.content}`
          });
          return {
            id: article.id,
            values: embedding.data[0], // ベクトルデータ
            metadata: { title: article.title, content: article.content }
          };
        })
      );

      // Vectorizeに保存
      await env.VECTORIZE_INDEX.upsert(embeddings);
      return new Response('挿入完了', { status: 200 });
    }

    // 2. 検索API
    if (url.pathname === '/search') {
      const query = url.searchParams.get('q');
      if (!query) return new Response('クエリパラメータ q が必要です', { status: 400 });

      // クエリをベクトル化
      const queryEmbedding = await env.AI.run('@cf/baai/bge-small-en-v1.5', {
        text: query
      });

      // 類似ベクトルを検索
      const results = await env.VECTORIZE_INDEX.query(queryEmbedding.data[0], {
        topK: 5,
        returnMetadata: true
      });

      return new Response(JSON.stringify(results.matches, null, 2), {
        headers: { 'Content-Type': 'application/json' }
      });
    }

    return new Response('Not found', { status: 404 });
  }
};

ローカルテスト

wrangler dev

別ターミナルでデータを投入し、検索してみます。

# データ投入
curl http://localhost:8787/insert
# 検索
curl "http://localhost:8787/search?q=サーバーレスプラットフォーム"

「サーバーレスプラットフォーム」と検索して、「Cloudflare Workers入門」がヒットすれば成功です!単語が一致していなくても意味で検索できています。

上級テクニック

  1. メタデータフィルタリング:
    技術記事だけ検索したい場合、検索時に filter: { category: 'tech' } を指定できます。
  2. ハイブリッド検索:
    ベクトル検索(意味)とキーワード検索(完全一致)を組み合わせ、さらにキーワードが含まれる場合にスコアを加算することで、より人間が納得しやすい検索結果を作れます。

第3部:トラブルシューティング

Q: 次元数不一致エラー (Dimension mismatch)
A: インデックス作成時とベクトル生成時でモデルが違います。両方とも同じモデル(例: 768次元のbge-small)を使っているか確認してください。

Q: 日本語検索の精度が低い
A: bge-small-en は英語向けです。日本語の場合は @cf/baai/bge-base-zh-v1.5 を使うと劇的に改善します。

Q: 検索結果が最新でない
A: Vectorizeは結果整合性モデルです。データを挿入してから検索可能になるまで数秒〜数十秒のラグがある場合があります。

結論

「ベクトルデータベースは高い」というのは過去の話です。
Vectorizeを使えば、コーヒー1杯分のコストすら掛けずに、最先端のセマンティック検索をあなたのアプリに組み込めます。

まずは無料枠で遊んでみてください。30分後には、あなたのアプリが「意味」を理解するようになっているはずです。

Vectorizeによるセマンティック検索導入フロー

Vectorizeのセットアップから検索APIの実装まで

⏱️ Estimated time: 30 min

  1. 1

    Step1: 環境構築

    Cloudflareアカウントを作成し、Wrangler CLIをインストール。wrangler loginでログインする。
  2. 2

    Step2: インデックス作成

    コマンド wrangler vectorize create <名前> --preset <モデル> を実行。wrangler.tomlに設定を追記する。
  3. 3

    Step3: API実装

    Workers AIでテキストをベクトル化し、Vectorizeにupsert(保存)する処理と、クエリベクトルを使ってquery(検索)する処理を実装。
  4. 4

    Step4: テスト実行

    wrangler devでローカルサーバーを起動し、curlでデータの登録と検索動作を確認する。

FAQ

Vectorizeの無料枠はどれくらいですか?
500万ベクトルまでのストレージと、月間300万回のクエリが無料です。個人開発や小規模サービスには十分すぎる容量です。
なぜPineconeより安いのですか?
Cloudflareは自社のグローバルネットワーク(エッジ)を活用しており、専用のインフラコストを抑えているためです。また、VectorizeはWorkersと統合されており、効率的なリソース管理が行われています。
OpenAIのEmbeddingモデルは使えますか?
はい、使えます。ただし、OpenAIのモデル(text-embedding-3-smallなど)は1536次元なので、Vectorizeのインデックス作成時にも1536次元の設定をする必要があります。コストを抑えるならCloudflare内蔵モデルがおすすめです。

4 min read · 公開日: 2025年12月1日 · 更新日: 2026年1月22日

コメント

GitHubアカウントでログインしてコメントできます

関連記事