サイトのAPI図鑑B版
掲載情報が正確でない可能性があります。
AI・機械学習API

OpenAI APIの使い方と料金体系の完全解説【GPT・Embeddings・DALL-E】

OpenAI APIのChat Completions・Embeddings・DALL-E・Whisper・TTS APIの使い方と料金を解説。プロンプトエンジニアリング・コスト最適化・セキュリティ対策まで網羅します。

#OpenAI#GPT#ChatGPT#Embeddings#DALL-E

OpenAI APIとは

OpenAI APIは、GPT・DALL-E・Whisper・Embeddings・TTS(テキスト読み上げ)などのAIモデルをHTTP APIとして利用できるサービスです。自然言語処理・画像生成・音声認識など多様なAI機能をプログラムから呼び出せます。2022年末のChatGPT公開以降、世界中の開発者が活用し、AI機能の実装がかつてないほど手軽になりました。

主要なAPIの種類

  • Chat Completions API:GPTモデルを使ったテキスト生成・対話(最もよく使われる)
  • Embeddings API:テキストをベクトルに変換(意味的類似性検索・RAGシステムに使用)
  • Images API(DALL-E):テキストから画像生成・画像編集
  • Audio API(Whisper・TTS):音声認識(文字起こし)・テキスト読み上げ
  • Moderation API:テキストの有害性チェック(無料)
  • Assistants API:コード実行・ファイル参照機能付きのマルチステップAIアシスタント

Chat Completions APIの基本実装

import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

const response = await openai.chat.completions.create({
  model: 'gpt-4o-mini',
  messages: [
    { role: 'system', content: 'あなたは親切なAIアシスタントです。' },
    { role: 'user', content: 'APIとは何か、初心者向けに説明してください。' }
  ],
  max_tokens: 500,
  temperature: 0.7,
});

console.log(response.choices[0].message.content);

料金体系(2026年時点の目安)

モデル入力(/1Mトークン)出力(/1Mトークン)
GPT-4o$2.50$10.00
GPT-4o mini$0.15$0.60
o3-mini$1.10$4.40

※料金は随時変更されます。最新情報はOpenAI公式サイトをご確認ください。1トークンは日本語で約1〜2文字に相当します。

プロンプトエンジニアリングのコツ

  • システムプロンプトで役割を明確に:AIの振る舞いを具体的に定義する
  • Few-shot learning:期待する出力例をプロンプトに含めて出力品質を向上させる
  • Chain of Thought:「ステップごとに考えてください」と追加することで論理的思考を促進
  • 出力フォーマットの指定:JSON形式・箇条書き等、後処理しやすい形式を指定
  • 温度(temperature)の調整:事実確認は0.0〜0.3、創造的タスクは0.7〜1.0

ストリーミングレスポンス

stream: trueを指定することで、トークンが生成されるたびにリアルタイムで受信できます。ChatGPTのような「タイピング中」の表示をUXに組み込む際に有用です。

RAG(Retrieval-Augmented Generation)

社内文書・製品マニュアル・FAQなどのカスタムデータをGPTに参照させるためのアーキテクチャです。Embeddings APIでドキュメントをベクトル化してベクターDBに保存し、ユーザーの質問と類似度が高いドキュメントをコンテキストとしてGPTに渡します。

コスト最適化

  • キャッシュの活用:同一の質問への回答をRedis等にキャッシュ
  • モデルの使い分け:単純なタスクはGPT-4o mini、複雑なタスクのみGPT-4o
  • Batch API:非リアルタイムな処理は50%割引のBatch APIを活用
  • トークン数の監視:ダッシュボードでコストをモニタリング

まとめ

OpenAI APIはAI機能の実装を大幅に民主化したサービスです。Chat Completions APIを中心に、Embeddings・DALL-E・Whisperを組み合わせることで多様なAIアプリケーションが構築できます。コスト管理・プロンプトエンジニアリング・セキュリティを意識しながら、自社サービスへのAI機能組み込みを進めてください。

よくある質問

Q.OpenAI APIはどのモデルを使えばよいですか?

用途によります。高精度・複雑なタスクにはGPT-4oを、コスト優先にはGPT-4o miniを、リアルタイム応答にはo3-miniを選ぶのが一般的です。埋め込みにはtext-embedding-3-small/largeを使います。最新モデルの一覧はOpenAIの公式ドキュメントで確認してください。

Q.APIコストを削減する方法は?

結果のキャッシュ(同じ質問への回答を保存)、プロンプトの最適化(不要なトークンを削減)、安価なモデルの活用(GPT-4o miniで十分なタスク)、max_tokensの設定(必要以上のレスポンスを防ぐ)、バッチ処理(Batch API使用で50%割引)などが有効です。

Q.OpenAI APIに個人情報を送っていいですか?

OpenAIの利用規約ではAPI経由で送ったデータをデフォルトでは学習に使わないとされています。ただし、センシティブな個人情報・企業の機密情報はプロンプトに直接含めず、匿名化・仮名化してから送ることを推奨します。Enterprise契約ではさらに強いデータ保護が提供されます。

関連記事