Google Gemini APIとは
Google Gemini APIはGoogleが提供するマルチモーダルAIモデル「Gemini」をAPIとして利用できるサービスです。Google AI Studio(無料・APIキー認証)またはVertex AI(Google Cloud・エンタープライズ向け)から利用できます。Geminiはテキスト・画像・音声・動画・コードを同時に処理できるマルチモーダル能力が特徴で、複雑なAIタスクに対応しています。
Geminiのモデルラインナップ(2026年時点)
- Gemini 1.5 Pro:最高品質・100万トークンのコンテキストウィンドウ・マルチモーダル対応
- Gemini 1.5 Flash:高速・低コスト・マルチモーダル対応(一般的なタスクに最適)
- Gemini 1.5 Flash-8B:さらに軽量・低コスト版
- Gemini 2.0 Flash:次世代の高速モデル(2026年に登場)
無料枠
Google AI Studioのプロジェクトでは無料のリクエスト枠が提供されます(Gemini 1.5 Flashは毎分15リクエスト・1日1,500リクエストなど)。小規模な開発・プロトタイプには無料枠で十分な場合があります。商用・大規模利用には従量課金(Pay as you go)プランに移行します。
基本実装
import { GoogleGenerativeAI } from '@google/generative-ai';
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });
// テキスト生成
const result = await model.generateContent(
'APIのセキュリティベストプラクティスを5つ教えてください'
);
console.log(result.response.text());
マルチモーダル機能(画像解析)
import { GoogleGenerativeAI } from '@google/generative-ai';
import * as fs from 'fs';
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });
// 画像解析
const imageData = fs.readFileSync('chart.png').toString('base64');
const result = await model.generateContent([
{
inlineData: {
mimeType: 'image/png',
data: imageData
}
},
'この画像のグラフを分析して、主要なトレンドを日本語で教えてください'
]);
console.log(result.response.text());
長文コンテキスト(100万トークン)の活用
Gemini 1.5 Proの100万トークンのコンテキストウィンドウは業界最大クラスで、長い文書・大きなコードベース・長い動画の一括処理が可能です。数十万字の書籍全体を一度に送って質問したり、大規模なコードリポジトリを分析したりするユースケースに対応できます。
Gemini APIの料金(Gemini 1.5 Flash・2026年時点の目安)
- 入力:$0.075/1Mトークン(128K以下)
- 出力:$0.30/1Mトークン(128K以下)
- 画像:$0.02/1,000画像
GPT-4o miniと比較しても競争力のある価格です。
Grounding(Googleサーチ連携)
Gemini APIはGoogleサーチとの統合(Grounding with Google Search)をサポートしており、最新の情報を検索してから回答を生成できます。知識のカットオフ日以降の情報が必要な場合やリアルタイムの情報が求められる用途に活用できます。
まとめ
Google Gemini APIは強力なマルチモーダルAI・長いコンテキストウィンドウ・競争力のある価格が特徴のAI APIです。無料枠を活用してプロトタイプを素早く構築でき、本番環境ではGoogle Cloudのエンタープライズ機能(Vertex AI)に移行できます。テキスト・画像・音声・動画を統合的に処理できるため、従来は複数のAPIを組み合わせていたタスクを一元化できます。