OpenAI APIとは
OpenAI APIは、GPT・DALL-E・Whisper・Embeddings・TTS(テキスト読み上げ)などのAIモデルをHTTP APIとして利用できるサービスです。自然言語処理・画像生成・音声認識など多様なAI機能をプログラムから呼び出せます。2022年末のChatGPT公開以降、世界中の開発者が活用し、AI機能の実装がかつてないほど手軽になりました。
主要なAPIの種類
- Chat Completions API:GPTモデルを使ったテキスト生成・対話(最もよく使われる)
- Embeddings API:テキストをベクトルに変換(意味的類似性検索・RAGシステムに使用)
- Images API(DALL-E):テキストから画像生成・画像編集
- Audio API(Whisper・TTS):音声認識(文字起こし)・テキスト読み上げ
- Moderation API:テキストの有害性チェック(無料)
- Assistants API:コード実行・ファイル参照機能付きのマルチステップAIアシスタント
Chat Completions APIの基本実装
import OpenAI from 'openai';
const openai = new OpenAI({
apiKey: process.env.OPENAI_API_KEY,
});
const response = await openai.chat.completions.create({
model: 'gpt-4o-mini',
messages: [
{ role: 'system', content: 'あなたは親切なAIアシスタントです。' },
{ role: 'user', content: 'APIとは何か、初心者向けに説明してください。' }
],
max_tokens: 500,
temperature: 0.7,
});
console.log(response.choices[0].message.content);
料金体系(2026年時点の目安)
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) |
|---|---|---|
| GPT-4o | $2.50 | $10.00 |
| GPT-4o mini | $0.15 | $0.60 |
| o3-mini | $1.10 | $4.40 |
※料金は随時変更されます。最新情報はOpenAI公式サイトをご確認ください。1トークンは日本語で約1〜2文字に相当します。
プロンプトエンジニアリングのコツ
- システムプロンプトで役割を明確に:AIの振る舞いを具体的に定義する
- Few-shot learning:期待する出力例をプロンプトに含めて出力品質を向上させる
- Chain of Thought:「ステップごとに考えてください」と追加することで論理的思考を促進
- 出力フォーマットの指定:JSON形式・箇条書き等、後処理しやすい形式を指定
- 温度(temperature)の調整:事実確認は0.0〜0.3、創造的タスクは0.7〜1.0
ストリーミングレスポンス
stream: trueを指定することで、トークンが生成されるたびにリアルタイムで受信できます。ChatGPTのような「タイピング中」の表示をUXに組み込む際に有用です。
RAG(Retrieval-Augmented Generation)
社内文書・製品マニュアル・FAQなどのカスタムデータをGPTに参照させるためのアーキテクチャです。Embeddings APIでドキュメントをベクトル化してベクターDBに保存し、ユーザーの質問と類似度が高いドキュメントをコンテキストとしてGPTに渡します。
コスト最適化
- キャッシュの活用:同一の質問への回答をRedis等にキャッシュ
- モデルの使い分け:単純なタスクはGPT-4o mini、複雑なタスクのみGPT-4o
- Batch API:非リアルタイムな処理は50%割引のBatch APIを活用
- トークン数の監視:ダッシュボードでコストをモニタリング
まとめ
OpenAI APIはAI機能の実装を大幅に民主化したサービスです。Chat Completions APIを中心に、Embeddings・DALL-E・Whisperを組み合わせることで多様なAIアプリケーションが構築できます。コスト管理・プロンプトエンジニアリング・セキュリティを意識しながら、自社サービスへのAI機能組み込みを進めてください。