AI画像生成APIの概要
テキストプロンプトから画像を生成するAI技術は2022〜2023年に急速に普及しました。DALL-E・Stable Diffusion・MidjourneyなどのモデルがAPIとして提供されており、Webサービス・アプリ・クリエイティブツールへの組み込みが可能になっています。マーケティング素材・ゲームアセット・プロダクトプロトタイプ・教育コンテンツなど多様な用途に活用されています。
主要AI画像生成API
OpenAI DALL-E 3 API
- 料金:1024×1024で$0.04/枚(Standard)、$0.08/枚(HD)
- 特徴:テキストの正確な反映・詳細なプロンプト解釈・商用利用可
- サイズ:1024×1024・1792×1024・1024×1792
Stability AI(Stable Diffusion API)
- 料金:クレジット方式($10=1,000クレジット、1枚=1〜8クレジット)
- 特徴:高いカスタマイズ性・多様なモデル・Img2Img対応
- オープンソース版:ローカルで無料実行可能(GPU推奨)
Midjourney(非公式API)
MidjourneyはDiscordボット経由での利用が主流で、公式APIはまだ限定公開です。サードパーティのAPIラッパーも存在しますが、利用規約の確認が必要です。
Ideogram API
- 特徴:日本語テキストを含む画像生成に比較的強い
- 料金:100クレジット/月(無料)から
DALL-E 3 APIの実装例
import OpenAI from 'openai';
const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });
const imageResponse = await openai.images.generate({
model: 'dall-e-3',
prompt: '富士山を背景に桜の木が咲いている、日本の春の風景、写真リアリスティック',
n: 1,
size: '1024x1024',
quality: 'hd',
response_format: 'url', // またはb64_json
});
const imageUrl = imageResponse.data[0].url;
console.log('生成画像URL:', imageUrl);
Stable Diffusion APIの実装(Stability AI)
const response = await fetch(
'https://api.stability.ai/v1/generation/stable-diffusion-xl-1024-v1-0/text-to-image',
{
method: 'POST',
headers: {
'Content-Type': 'application/json',
'Authorization': `Bearer ${process.env.STABILITY_API_KEY}`
},
body: JSON.stringify({
text_prompts: [
{ text: 'A beautiful sunset over Mount Fuji, photorealistic', weight: 1.0 },
{ text: 'blurry, low quality', weight: -1.0 } // ネガティブプロンプト
],
cfg_scale: 7,
height: 1024,
width: 1024,
steps: 30,
samples: 1,
})
}
);
プロンプトエンジニアリングのポイント
- スタイルの指定:「photorealistic」「oil painting」「anime style」など画風を指定
- 構図の指定:「wide angle」「close-up portrait」「bird's eye view」など
- 照明の指定:「golden hour lighting」「studio lighting」「dramatic shadows」
- 品質ワード:「8K resolution」「highly detailed」「professional photography」
- ネガティブプロンプト(SD):「blurry, low quality, distorted, ugly」で低品質な生成を抑制
商用利用と著作権
AI生成画像の著作権は各国・各サービスで取り扱いが異なります。日本では現時点でAI生成画像のみへの著作権保護は認められていませんが、人間のクリエイティブな判断が関わる場合は保護される可能性があります。商用利用を行う場合は各サービスの利用規約を確認し、法的リスクを考慮してください。
まとめ
AI画像生成APIはクリエイティブコンテンツの制作効率を大幅に向上させます。DALL-E 3はシンプルなAPIと高品質な生成でビジネス用途に向いており、Stable Diffusionはカスタマイズ性と低コストが特徴です。商用利用の際は各サービスの最新の利用規約と著作権の扱いを確認してから使用してください。