サイトのAPI図鑑B版
掲載情報が正確でない可能性があります。
AI・機械学習API

Google Gemini APIの活用ガイド【マルチモーダルAI・無料枠対応2026年版】

Google Gemini API(Gemini 1.5 Pro/Flash)の使い方・マルチモーダル機能(テキスト・画像・音声・動画)・料金・無料枠・Vertex AIとの違いを解説します。

#Google Gemini#AI#マルチモーダル#Google AI

Google Gemini APIとは

Google Gemini APIはGoogleが提供するマルチモーダルAIモデル「Gemini」をAPIとして利用できるサービスです。Google AI Studio(無料・APIキー認証)またはVertex AI(Google Cloud・エンタープライズ向け)から利用できます。Geminiはテキスト・画像・音声・動画・コードを同時に処理できるマルチモーダル能力が特徴で、複雑なAIタスクに対応しています。

Geminiのモデルラインナップ(2026年時点)

  • Gemini 1.5 Pro:最高品質・100万トークンのコンテキストウィンドウ・マルチモーダル対応
  • Gemini 1.5 Flash:高速・低コスト・マルチモーダル対応(一般的なタスクに最適)
  • Gemini 1.5 Flash-8B:さらに軽量・低コスト版
  • Gemini 2.0 Flash:次世代の高速モデル(2026年に登場)

無料枠

Google AI Studioのプロジェクトでは無料のリクエスト枠が提供されます(Gemini 1.5 Flashは毎分15リクエスト・1日1,500リクエストなど)。小規模な開発・プロトタイプには無料枠で十分な場合があります。商用・大規模利用には従量課金(Pay as you go)プランに移行します。

基本実装

import { GoogleGenerativeAI } from '@google/generative-ai';

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });

// テキスト生成
const result = await model.generateContent(
  'APIのセキュリティベストプラクティスを5つ教えてください'
);
console.log(result.response.text());

マルチモーダル機能(画像解析)

import { GoogleGenerativeAI } from '@google/generative-ai';
import * as fs from 'fs';

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });

// 画像解析
const imageData = fs.readFileSync('chart.png').toString('base64');

const result = await model.generateContent([
  {
    inlineData: {
      mimeType: 'image/png',
      data: imageData
    }
  },
  'この画像のグラフを分析して、主要なトレンドを日本語で教えてください'
]);
console.log(result.response.text());

長文コンテキスト(100万トークン)の活用

Gemini 1.5 Proの100万トークンのコンテキストウィンドウは業界最大クラスで、長い文書・大きなコードベース・長い動画の一括処理が可能です。数十万字の書籍全体を一度に送って質問したり、大規模なコードリポジトリを分析したりするユースケースに対応できます。

Gemini APIの料金(Gemini 1.5 Flash・2026年時点の目安)

  • 入力:$0.075/1Mトークン(128K以下)
  • 出力:$0.30/1Mトークン(128K以下)
  • 画像:$0.02/1,000画像

GPT-4o miniと比較しても競争力のある価格です。

Grounding(Googleサーチ連携)

Gemini APIはGoogleサーチとの統合(Grounding with Google Search)をサポートしており、最新の情報を検索してから回答を生成できます。知識のカットオフ日以降の情報が必要な場合やリアルタイムの情報が求められる用途に活用できます。

まとめ

Google Gemini APIは強力なマルチモーダルAI・長いコンテキストウィンドウ・競争力のある価格が特徴のAI APIです。無料枠を活用してプロトタイプを素早く構築でき、本番環境ではGoogle Cloudのエンタープライズ機能(Vertex AI)に移行できます。テキスト・画像・音声・動画を統合的に処理できるため、従来は複数のAPIを組み合わせていたタスクを一元化できます。

よくある質問

Q.Gemini APIとVertex AIの違いは何ですか?

Gemini APIはGoogleのAI Studio(aistudio.google.com)から利用でき、個人・スタートアップ向けにシンプルに使えます。Vertex AIはGoogle Cloudのエンタープライズ向けMLプラットフォームで、セキュリティ・コンプライアンス・カスタムチューニングに優れています。

Q.Gemini APIは日本語対応していますか?

はい。Gemini 1.5 Pro・Flashは日本語を含む100以上の言語に対応しています。日本語での質問・回答、日本語テキストの要約・翻訳・コード生成などが可能です。

Q.Gemini APIで動画を解析できますか?

はい。Gemini 1.5 Proはテキスト・画像・音声・動画・コードを統合的に処理するマルチモーダルモデルです。動画ファイルをAPIに送ることで、内容の要約・シーンの説明・字幕生成などが実現できます。

関連記事