AI 画像生成を試したけれど、思い通りの絵がなかなか出ない——「呪文集」を覚えるべきか、英語で書くべきか、迷っていませんか。実際、ラッコキーワードの実測(2026 年 5 月時点)でも「AI 画像生成 プロンプト」は月 1,300 人以上が検索しており、私自身もブログのサムネ/OG/資料イラスト/UI モックを、業務で 4 要素モデルに沿って日常的に書いています。
結論から言うと、プロンプトは「主題 × スタイル × 構図 × 制約」の 4 要素で組み立てれば、未経験でも 5 分で狙い通りの画像に近づけるのが筋です。本記事では、4 要素モデルの組み立て方、用途別テンプレ、失敗パターン 7 つ、調整チェックリスト 5 ステップ、職種別のプロンプト集まで、UI ベース 6 ツールでこのモデルを業務で使っている現役の生成AIエンジニア視点で整理します。
プロンプトの型を知りたい方は セクション 1〜2、用途別テンプレは セクション 3〜6、思い通りに出ないときの直し方は セクション 8〜9、中上級者向けは セクション 7、職種別の使い方は セクション 10 から、という順で読み進められます。
結論——プロンプトは「主題 × スタイル × 構図 × 制約」の4要素で組む
📖 この章で使う用語
- プロンプト:AI に「こういう画像を作って」と伝えるテキスト指示。料理のレシピに近い役割です。
- 主題:4 要素モデルの第 1 要素。何を描くか(人・物・場面)。
- スタイル:4 要素モデルの第 2 要素。どのテイストで描くか(フラットデザイン/水彩 等)。
- 構図:4 要素モデルの第 3 要素。どう見せるか(中央配置/俯瞰 等)。
- 制約(除外条件):4 要素モデルの第 4 要素。何を入れないか(文字なし/人物なし 等)。
結論から書きます。AI 画像生成で「狙い通りの画像」に近づけたいなら、プロンプトを 「主題 × スタイル × 構図 × 制約」の 4 要素で組むのが、最も応用が利く型です。私自身、現役の生成AIエンジニアとして、業務でも個人でも、この 4 要素モデルだけで日常の画像生成を回しています。
各要素の役割を整理します。
- 主題:何を描くか。人・物・場面・概念のいずれか「ひとつ」を中心に。
- スタイル:どのテイストで描くか。「フラットデザイン」「水彩」「写実」など具体名詞で。
- 構図:どう見せるか。「中央配置」「俯瞰」「クローズアップ」など視点の指定。
- 制約:何を入れないか。「文字なし」「人物なし」「実在ブランドなし」など。
4 要素のうち 1 つでも欠けると、私の体感では「狙いから外れる確率」が一段上がります。特に制約は未経験読者が忘れがちな要素で、「文字を入れないで」「人物を入れないで」を明示しないと、AI は勝手にそれらを入れてくることが多いので、最後の 1 要素として必ず付けるのが安定運用のコツです。
ここで本記事のスタンスを 1 つだけお伝えします。SERP 上位の競合記事は「呪文 100 選」「英語プロンプト辞書」「Midjourney のフラグ集」など、プロンプトの語彙を羅列する記事が並んでいます。語彙集を否定するつもりはありませんが、未経験読者にとっては「結局、何をどう組み立てればいいのか」が見えにくい構造です。本記事は語彙の暗記ではなく**「型」で語る**ことを主軸に据えました。4 要素モデルは、業務日常で使う UI ベースの 6 ツール(ChatGPT 経由の DALL-E 3 / Microsoft Designer / Bing Image Creator / Gemini Image (Imagen) / Adobe Firefly / Canva AI)すべてで通用する組み立て方です。Midjourney や Stable Diffusion ローカルなどの中上級者向けツールは業務で深く触っていないので、セクション 7 で「公開情報からの概論レベル」の温度感に分けて別建てします。第14本目「AI 画像生成 無料」で UI ベース 6 ツールの俯瞰を読み終えた方は、本記事を読み進める順番として最適です。未読の方はAI 画像生成 無料に目を通すと、ツール選びとプロンプト技法がセットで理解できると思います。
4要素モデルを実例で組み立てる——ブログサムネを例に
📖 この章で使う用語
- (セクション 1 で導入済みのため、本章で新規の用語はありません)
ここからは 4 要素モデルを「実例」で組み立てます。本ブログのサムネ作成を題材に、段階的に要素を足していくと、各要素が「どれくらい当たりに効くか」が見えてきます。題材はClaude 使い方のサムネです。
段階 1:主題だけ
AI とロボットのアイコン
これだけだと、テイスト・構図・背景が AI 任せになり、リアル写真風/メカ調/3D 調と方向性が散らばります。当たる確率は 1-2 割程度の体感です。
段階 2:主題 + スタイル
AI とロボットのアイコン、フラットデザイン
「フラットデザイン」と書くだけでテイストが一気に絞れて、ベクター調のシンプルなイラストが出やすくなります。当たる確率が 3-4 割に上がる感覚です。
段階 3:主題 + スタイル + 構図
AI とロボットのアイコン、フラットデザイン、中央配置、背景は薄いグレー
被写体が画面の隅に寄ったり、背景が派手で被写体が埋もれたりというブレが減ります。当たる確率は 4-5 割に上がる体感です。
段階 4:主題 + スタイル + 構図 + 制約
AI とロボットのアイコン、フラットデザイン、中央配置、背景は薄いグレー、文字なし、人物なし
「文字なし」「人物なし」を明示することで、AI が勝手にそれらを入れてくる現象が大きく減ります。当たる確率は 6-7 割に上がる、というのが私の体感です(個人差はあります)。
| 段階 | プロンプトの内容 | 当たる体感 |
|---|---|---|
| 段階 1 | 主題だけ | 1-2 割 |
| 段階 2 | + スタイル | 3-4 割 |
| 段階 3 | + 構図 | 4-5 割 |
| 段階 4 | + 制約 | 6-7 割 |
特に**制約(除外条件)**は最後の 1 要素として最重要だと感じます。「文字なし」「人物なし」「実在ブランドなし」を明示するだけで一段上がる体感があるので、4 要素モデルを覚えるときは「制約を忘れない」を意識してみてください。4 要素モデルは UI ベース 6 ツール(DALL-E 3 / Microsoft Designer / Bing / Gemini Image / Adobe Firefly / Canva AI)すべてで通用する組み立て方で、ツールごとの細かい癖はありますが基本姿勢は共通します。
用途別プロンプト型——サムネ作成(業務で実際に使っているもの)
📖 この章で使う用語
- サムネ:ブログ記事のタイトル横や記事一覧に表示される「目を引くための画像」のことです。
- 1 要素ルール:サムネに詰め込む要素を「ひとつだけ」にするセルフルールです。
私が業務で使っているサムネ作成用の 4 要素テンプレを公開します。第14本目 セクション 5「サムネ作成の Tips」と射程は近いですが、第14本目はステップ手順中心、本記事はプロンプトの 4 要素テンプレ中心で重複させずに書きます。サムネ作成のステップ手順はAI 画像生成 無料 を参照してください。
サムネ作成用 4 要素テンプレ
- 主題:記事のテーマを「1 つ」に絞る(例:「Claude 使い方」記事ならロボットのアイコン 1 つ)
- スタイル:フラットデザイン/ミニマル/薄いカラー
- 構図:中央配置/読みやすい余白/視線が 1 点に集まる
- 制約:文字なし/人物なし/著名キャラなし
プロンプトの実例は次のような形です。
記事サムネ用のアイコン。主題:ロボットの顔のアイコン。スタイル:フラットデザイン、薄いブルー基調。構図:中央配置、背景は薄いグレー。制約:文字なし、人物なし、著名キャラなし。
DALL-E 3 (ChatGPT) に投げて 3-4 枚生成 → 1 番マシなものを選んで Canva で文字乗せ、というのが私のパターンです。
1 要素ルールを徹底する
4 要素モデルの主題側で、私が徹底しているセルフルールが「1 要素ルール」です。サムネに入れる主題は「ひとつだけ」にする。ロボットと猫とビジネスマンを全部入れたくなる気持ちは私もよく分かりますが、要素を 4 つ詰めると視覚的に「何のサムネか」が伝わらなくなります。「Claude 使い方」記事ならロボットだけ、「RAG とは」記事なら本屋の棚だけ、というように 1 サムネに 1 要素を徹底し、残りのスタイル・構図・制約はその 1 要素を引き立てるフレームと考えています。
主軸ツールはDALL-E 3 (ChatGPT) でラフ生成 → Canva AI で文字乗せの 2 段構え。DALL-E 3 は対話的に微調整できる強みがあり、「もう少し明るくしてほしい」を会話で送れるのが大きな利点です。
用途別プロンプト型——OG 画像(業務で実際に使っているもの)
📖 この章で使う用語
- OG 画像:Web ページを SNS でシェアしたときに表示されるサムネ画像。「Open Graph Image」の略です。
- 1200×630 ピクセル:OG 画像の標準サイズ。Twitter / Facebook / LinkedIn など主要 SNS が採用しています。
OG 画像はブログ記事を SNS でシェアしたときに自動表示されるサムネで、サムネと役割が似ていますがSNS 上でクリックを取る役割が強い領域です。
OG 画像用 4 要素テンプレ
- 主題:記事のテーマ + サイトロゴが入る余白を確保
- スタイル:清潔感/明るい色味/読みやすい
- 構図:横長 1200×630/文字を入れる前提の余白を画面左右に確保
- 制約:人物なし/実在ブランドなし/透かしなし
プロンプトの実例は次のような形です。
OG 画像用のイラスト。主題:AI と本のイメージ、横長レイアウト。スタイル:フラットデザイン、明るい青と白の配色、清潔感あり。構図:横長 1200×630、被写体は左寄せ、右側にテキスト用の余白を大きく取る。制約:人物なし、実在ブランドなし、透かしなし、文字なし。
サムネとの違いは、「構図」に「文字を入れる余白の指定」が入る点です。SNS のタイムラインで OG 画像が表示されるとき、タイトル文字を後乗せする想定で右側に余白を取っておくと、文字と画像が重なりません。主軸ツールはCanva AI(横長規格テンプレ)と Adobe Firefly(商用利用安全性を取りたいとき)。Canva AI は 1200×630 の OG 規格テンプレが最初から用意されていて、生成→キャンバス配置→文字乗せ→PNG 書き出しが画面内で完結します。商用利用安全性を強く取りたいクライアントワークなどでは、Adobe Firefly で生成して Canva に持ち込む流れも使います。
用途別プロンプト型——資料イラスト(業務で実際に使っているもの)
📖 この章で使う用語
- ピクトグラム調:人物・物を「シンプルなシルエットアイコン」で表すスタイル。トイレや非常口の案内表示の絵柄をイメージしてください。
- トーン&マナー:ブランドや事業の「世界観・雰囲気」を一貫させるためのデザイン基準のことです。
資料イラストは、社内資料・営業資料・議事録・提案書に入れる「説明用のイラスト」のことです。フリー素材サイトで「業界×イメージ」を 30 分検索しても微妙な素材しか見つからない領域なので、AI 画像生成と相性が良い用途のひとつです。
資料イラスト用 4 要素テンプレ
- 主題:業界イメージ/業務フロー/概念図のラフ
- スタイル:シンプルなアイコン調/ビジネス向け/ピクトグラム調
- 構図:シンプル/中央配置/余白多め
- 制約:実在企業ロゴなし/人物の顔は描かない/個人情報を匂わせない
プロンプトの実例は次のような形です。
資料イラスト用。主題:物流倉庫の俯瞰イメージ。スタイル:ピクトグラム調、シンプルなアイコン、ビジネス向け。構図:俯瞰、中央配置、余白多め。制約:実在企業ロゴなし、人物の顔は描かない、文字なし。
「人物の顔は描かない」「個人情報を匂わせない」のような制約は業務利用で特に大事です。社内資料に顔つきの AI イラストを入れると違和感が出るので、人物はシルエットかピクトグラムで表現するのが落ち着くと思います。主軸ツールはGemini Image (Imagen) と Canva AI。Gemini Image は日本語プロンプトの精度がかなり安定していて、「業務フロー」「業界イメージ」のような日本語特有の抽象概念をそのまま伝えやすい体感があります。
私は profile §1 にある通り、営業 7 年 → 未経験 SE → 自社開発の 3 段階キャリアを経ています。営業時代を振り返ると、1 日約 60 件の訪問の前に、訪問先業界のイメージ図を 3 分で作って提案資料に添えていたら、初回訪問の印象が違ったかもしれない、と思います(仮定形です)。フリー素材サイトを 30 分回って結局微妙な素材しか見つからない、という時間ロスがゼロになる体感があります。
用途別プロンプト型——UI モックアップ(業務で実際に使っているもの)
📖 この章で使う用語
- UI モックアップ:アプリや Web 画面の「こんな見た目にしたい」を表す試作画像。エンジニア・デザイナー間の意思疎通で使います。
- ワイヤーフレーム:UI モックよりさらに簡素な、「画面の骨組み」だけを描いた図のことです。
- 対話的微調整:チャット画面で「もう少しこうしてほしい」と追加指示を会話で送る運用のことです。
UI モックアップは、新しい機能の試作画像や、エンジニア・デザイナー間で「こんな画面にしたい」を共有するためのラフ画像です。私は現職(自社開発)で、開発議論の入口として UI モックを AI で作ることが多いです。
UI モック用 4 要素テンプレ
- 主題:アプリ/Web の画面要素(ボタン/フォーム/カード等)
- スタイル:UI モックアップ/ワイヤーフレーム/フラットデザイン
- 構図:画面いっぱい/ボタン配置の明示/余白の指定
- 制約:実在サービスのコピーなし/個人情報なし/文字は仮文字で OK
プロンプトの実例は次のような形です。
スマホアプリの UI モックアップ。主題:商品一覧画面、カード形式のリスト、上部に検索バー、下部にタブメニュー。スタイル:フラットデザイン、明るい白基調、UI モック調。構図:画面いっぱい、カードは縦並び 3 つ、タブは 4 つ。制約:実在サービス名なし、個人情報なし、文字は『商品名』『価格』などの仮文字で OK。
UI モックは「文字なし」の制約を入れず、「仮文字で OK」と明示するのが私のやり方です。商品名や価格が空白だと UI の見た目が掴みにくいので、「商品名」「¥1,000」のような仮文字を入れた状態で生成してもらいます。
主軸ツールはDALL-E 3 (ChatGPT) と Adobe Firefly。DALL-E 3 は対話的微調整ができる強みがあり、1 回目のラフを出した後に「もう少し余白を増やしてほしい」「ボタンを丸くしてほしい」「タブメニューのアイコンをシンプルに」のような追加指示を会話で 2-3 ターン送ると、徐々に意図に近づきます。UI のような繊細な調整は、1 発のプロンプトで完成させるより対話で詰めていく方が結果的に速いです。クライアントワークなど商用利用の安全性をしっかり取りたいときは Adobe Firefly を選択肢に入れます。エンジニア向けの AI 活用は、Claude 使い方 や AI 業務効率化 ツール も合わせて読むと画像生成と他の活用のつながりが見えてきます。
中上級者向けプロンプト概論——Midjourney / Stable Diffusion 系
📖 この章で使う用語
- Discord:海外発のチャットアプリ。Midjourney は Discord 経由で操作します。
- フラグ:プロンプトの末尾に書く「細かい設定オプション」。Midjourney の
--ar 16:9(アスペクト比指定)が代表例です。- アスペクト比:画像の縦横比のこと。「16:9」はワイド画面の比率です。
- ポジティブプロンプト/ネガティブプロンプト:「これを入れてほしい」を伝える通常のプロンプトと、「これを入れないでほしい」を伝える Stable Diffusion 系の仕組み。
- モデル(チェックポイント)/LoRA:Stable Diffusion で「どのスタイルで描くか」を決める設定ファイルと、特定のスタイル・キャラを追加学習させる軽量な仕組み。
ここから先は、SERP 上で「AI 画像生成 プロンプト」に出てくる中上級者向けツール群の公開情報からの概論レベルの紹介です。本記事の主軸(業務日常で使う UI ベース 6 ツール)と射程が異なるので、温度感を意図的に分けます。
最初に正直な距離感を書きます。Midjourney / Stable Diffusion ローカル / Leonardo / NovelAI / Krea / FLUX.1 / Ideogram などのツールについて、私は業務でちゃんと使っていません。個人で軽く触った経験はありますが、実体験として「業務で使ってこう感じた」と語れるレベルではないので、本章は概要のみに留めます。SERP 上位に多い「呪文集羅列」記事のような語彙の網羅は本記事ではしません。専門書籍・公式ドキュメント・コミュニティの参照を強くおすすめします。
Midjourney のプロンプト概論
Midjourney は Discord 経由で操作する画像生成 AI です。Discord のチャット画面に /imagine コマンドで指示を送ると画像が返ってきます。プロンプトの構造としては、4 要素モデルの考え方は同様に通用しますが、Midjourney 固有のフラグを末尾に付けるのが特徴で、--ar 16:9(アスペクト比 16:9 のワイド指定)、--stylize 250(スタイル強度)、--no text(「文字を入れない」の除外指定)などが知られています。英語プロンプトの方が安定する傾向が一般的に知られています。詳細はMidjourney 公式(2026-05-15 取得)を参照してください。
Stable Diffusion ローカル系のプロンプト概論
Stable Diffusion はオープンソースの画像生成 AI で、ローカル環境(自分の PC)で動かす運用が広く知られています。プロンプトの構造は UI ベース 6 ツールとは違い、「ポジティブプロンプト」と「ネガティブプロンプト」の 2 軸で書くのが標準的です。加えてモデル(チェックポイント)/LoRA/VAE などの設定ファイルを組み合わせて出力のスタイルを細かく制御します。環境構築には GPU 付きの PC・Python・モデルファイルのダウンロードなどが必要で、未経験読者にとっては摩擦が大きい領域です。詳細はStability AI 公式(2026-05-15 取得)を参照してください。UI ベース 6 ツールでネガティブプロンプト機能は基本的に提供されていませんが、4 要素モデルの制約要素に「文字なし/人物なし」と書けば同様の効果が得られる体感です。
その他ツール群の一般概論
第14本目 セクション 6 と同じ温度感で、1-2 行ずつ概論を書きます。Leonardo はゲームアセット・キャラクターデザインに強いと評され、NovelAI はアニメ・イラスト調に特化、Krea はリアルタイム生成体験が特徴、FLUX.1 は高品質モデルで複数サービスから利用可能、Ideogram は文字を含む画像生成の精度が高いと評されるサービスです。中上級者向けに踏み込みたい方は専門書籍・公式ドキュメント・コミュニティ(Discord/Reddit)を参照することをおすすめします。本記事はあくまで UI ベース 6 ツールの実体験を主軸に据える立場なので、中上級者向けの呪文集化は意図的に避けています。
失敗パターン(Anti-pattern)——典型的に外す書き方7つ
📖 この章で使う用語
- Anti-pattern(アンチパターン):「やってしまいがちな、失敗につながるパターン」のこと。プログラミング由来の用語ですが、プロンプトにも使えます。
- 抽象語/具体語:抽象語は「シンプル」「きれい」のような曖昧な表現、具体語は「フラットデザイン」「白背景」のような具体的な表現のことです。
「思った通りの画像が出ない」典型的な失敗パターンを 7 つ整理します。①〜⑥ は私の業務体感ベースの実体験、⑦ は公開情報からの概論として紹介する扱いです。
① 主題を 1 つに絞っていない(業務で実際に使っているもの):「ロボットと猫とビジネスマンとサーバー室」のように 4 つも 5 つも要素を詰めると、AI は全部を画面に入れようとして散らかります。直し方は 4 要素モデルの主題側で 1 要素ルールを徹底する。
② スタイルが曖昧(業務で実際に使っているもの):「シンプルで」「いい感じに」のような抽象語だけで指示すると、出力がブレます。直し方は「フラットデザイン」「ミニマル」「水彩」「ピクトグラム調」など具体名詞で書く。スタイル語彙を 5-10 個持っておくと用途別に使い分けられます。
③ 構図の指定がない(業務で実際に使っているもの):「中央配置」「俯瞰」「クローズアップ」などの視点指定がないと、AI 任せで画面構成が決まります。直し方は構図ボキャブラリーを 5-10 個持っておく(中央配置/俯瞰/クローズアップ/左右対称/斜め俯瞰 など)。
④ 制約(除外条件)を書いていない(業務で実際に使っているもの、最重要):私の体感で最も大きく結果が変わるのがここです。「文字を入れないで」「人物を入れないで」「実在ブランドを入れないで」を明示しないと、AI は勝手にそれらを入れて来ます。直し方は 4 要素モデルの最後で必ず制約を明示する。「文字なし/人物なし/実在ブランドなし/透かしなし」を用途に応じて 2-3 個書きます。
⑤ 1 発で完成を目指してしまう(業務で実際に使っているもの):1 枚目で当たらなかったから諦める、というパターンです。AI 画像生成は同じプロンプトでも 1 回ごとに出力が変わる仕組みなので、1 発完成は現実的ではありません。直し方は同じプロンプトで3 枚生成して 1 番マシなものを選ぶ運用にする。これだけで私の体感では失敗の 7 割が回避できます。
⑥ 1 つのツールに固執する(業務で実際に使っているもの):「DALL-E 3 で出ないから無理だ」と諦めるパターン。実はツールごとに得意領域が違うので、1 ツールに固執しないのが安定運用のコツです。直し方は 6 ツール(DALL-E 3 / Microsoft Designer / Bing / Gemini Image / Adobe Firefly / Canva AI)のうち最低 2-3 個を使えるようにしておく。DALL-E 3 で意図と離れた絵が出たら Imagen に換えて同じプロンプトを投げてみる、というツール切替で当たることが多いです。
⑦ 日英の使い分け/抽象語の具体化(公開情報からの概論として紹介する扱い、aikun の常用ではない):日英切替(日本語で当たらない時は英語、英語で当たらない時は日本語)と、抽象語の具体化(「シンプル」を「フラットデザイン、白背景、要素 1 つ」のように具体名詞で書き直す)は、SERP 上の競合記事で一般的に紹介されているテクニックです。私自身は手元で常用していないので断定的に「やるべき」とは言いません。4 要素モデル+3 枚生成+ツール切替を試しても当たらないときの、追加の選択肢として紹介しておきます。
「画像が思い通りに出ない時」の調整チェックリスト
📖 この章で使う用語
- (本章の用語は前章までで導入済みのため、新規はありません)
1 枚目で当たらなかった時の、私の業務での調整チェックリストを 5 ステップでまとめます。ステップ 1-3 が aikun の実体験、ステップ 4-5 は公開情報からの概論として紹介する扱いです。
ステップ 1:3 枚生成して 1 番マシなものを選ぶ(業務で実際に使っているもの)
最初にやるのはこれです。AI 画像生成は同じプロンプトでも 1 回ごとに出力が変わる仕組みなので、1 発で完成を目指さない。同じプロンプトで 3 枚生成して、1 番マシなものを選ぶ運用にしておけば、私の体感では失敗の 7 割が回避できます。「1 枚目で当たらなかったらプロンプトを直す」のは順番が逆で、まずは 3 枚出して 1 番マシを見てから必要に応じて直す方が時間効率が良いです。
ステップ 2:ツールを切り替えて出し直す(業務で実際に使っているもの)
3 枚試して 1 番マシなものが「使えない」場合はツールを切り替えます。DALL-E 3 (ChatGPT) で意図と離れた絵が出たら Gemini Image (Imagen) に換えて同じプロンプトを投げてみる、という運用です。ツールごとに得意領域が違うので、6 ツールの組み合わせで用途ごとの相性が見えてきます。サムネは DALL-E 3 が当たりやすい、資料イラストは Gemini Image が当たりやすい、OG 画像は Canva AI が当たりやすい、という体感です(個人差はあります)。
ステップ 3:4 要素モデルで欠けている要素を補う(業務で実際に使っているもの)
ステップ 1-2 を試してもまだ当たらないときは4 要素のどれが欠けているかをチェックします。私の体感では「制約」と「構図」が欠けているケースが多いです。制約の確認は「文字なし」「人物なし」「実在ブランドなし」を入れているか、構図の確認は「中央配置」「俯瞰」「クローズアップ」のような視点指定を入れているか。主題とスタイルだけで投げているプロンプトに制約と構図を足すだけで、当たる確率が一段上がる体感があります。
ステップ 4:日英切替を試してみる(公開情報からの概論として紹介する扱い、aikun 常用ではない)
ここから先は公開情報からの概論として紹介する扱いです。SERP 上の競合記事で一般的に紹介されているテクニックとして、日本語で当たらない時は英語で、英語で当たらない時は日本語で、というアドバイスがよく出てきます。私自身は手元で常用していないので断定的に「効く」とは言いません。日本語プロンプトの方が解釈精度が高いツール(DALL-E 3 / Gemini Image / Canva AI / Microsoft Designer)と、英語プロンプトの方が安定するツール(Adobe Firefly や中上級者向けツール)があるという話は一般的に知られています。
ステップ 5:抽象語を具体語に置き換える(公開情報からの概論として紹介する扱い、aikun 常用ではない)
これも公開情報からの概論として紹介する扱いです。「シンプル」「きれい」のような抽象語を「フラットデザイン、白背景、要素 1 つ」のような具体名詞に置き換えると当たりやすくなる、というのが一般的に知られています。私自身は 4 要素モデルでスタイル要素に最初から具体名詞で書く運用にしているので、ステップ 5 のような事後の言い換えを意識的にやることは少ないです。
aikun 業務での実運用ベスト 2
5 ステップを書きましたが、私の業務日常ではステップ 1 と 2 の 2 つだけを徹底すれば、8 割の場面で回ります。「3 枚生成して 1 番マシを選ぶ」「ツールを切り替えて出し直す」この 2 つの徹底だけで業務日常はほぼ問題なく回る、というのが正直な実感です。残りの 2 割はステップ 3(4 要素モデルで欠けを補う)で対処し、それでも当たらない 1 割の場面でステップ 4-5(一般論として知られているテクニック)を追加で試す、という順番が私のおすすめです。
職種別おすすめプロンプト集(Before/After/所要時間/最初の壁)
📖 この章で使う用語
- Before / After:AI を使わない状態 → AI を使った状態の対比のこと。
職種別の使い方を 5 本のユースケースで整理します。第14本目 セクション 9 / セクション 10 がツール選びと使い方の整理だったのに対し、本記事はプロンプト技法の深掘りに集中するので、4 要素モデルを各職種でどう活かすかを書きます。対象とする職種は profile §1 / §4 にある営業/事務/個人事業主/副業ライター/エンジニアの 5 つです。profile にない職種(医師・士業・看護師など)は創作になってしまうため扱いません。
① 営業職——提案資料に「業界イメージ図」を入れる
- Before:フリー素材サイトで「○○業界 イメージ」と検索して 30 分回り、結局微妙な素材しか見つからずに諦める
- After:4 要素モデル(主題=業界イメージ/スタイル=フラットデザイン/構図=俯瞰/制約=実在企業ロゴなし、人物の顔なし)で 3 枚生成 → 1 番マシを選ぶ → Canva AI でテキストを乗せる
- 所要時間:5-7 分(個人差があります)
- 最初の壁:「業界イメージを言葉でどう表現するか」のボキャブラリー不足。最初の 1 ヶ月は大きな単語しか出てこなくても、3 ヶ月続けると業界ごとの具体名詞(「物流倉庫の俯瞰」「金融街のビル群」など)が貯まってきます
営業 7 年の感覚で言うと、提案資料の表紙に業界イメージ図が 1 枚あるだけで初回訪問の印象が変わる体感はあります。営業時代の私だったら、まずこの用途から試したと思います。
② 事務職——議事録に「概念図」を入れる
- Before:「業務フロー図」とだけ書いた指示で Gemini にざっくり出して、複雑すぎる図が出てやり直し
- After:4 要素モデル(主題=業務フロー/スタイル=ピクトグラム調/構図=シンプル、矢印は最小限/制約=文字なし、複雑にしすぎない)で 3 枚生成 → Canva AI に持ち込んでテキストを足す
- 所要時間:5-8 分
- 最初の壁:Canva の操作画面に慣れる。最初の 30 分はテンプレートを見ながら触る練習にあててみてください
③ 個人事業主——SNS 投稿画像のテンプレ化
- Before:毎回プロンプトをゼロから書いて、毎回違うトーンの投稿が並び SNS の世界観が散らかる
- After:4 要素モデルのスタイル・構図・制約は固定しておき、主題だけ差し替える運用。「スタイル:フラットデザイン、ベージュ基調」「構図:横長、被写体は中央」「制約:文字なし、実在ブランドなし」を固定して、主題だけ「コーヒー」「読書」「散歩」と差し替えると世界観が一貫します
- 所要時間:1 投稿目 10 分(テンプレ確定)/2 投稿目以降 3-5 分
- 最初の壁:自分の事業のトーン&マナーを 4 要素で言語化する。「ベージュ基調」「やわらかい」「手書き風」のような事業らしさを表す具体名詞を、最初の 1 ヶ月で 5-10 個貯めるのが現実的です
④ 副業ライター——記事サムネのプロンプト型化
- Before:記事ごとにプロンプトをゼロから書いて、サムネに 30 分かけてしまう
- After:サムネ用 4 要素テンプレ(主題=記事テーマ 1 要素/スタイル=フラットデザイン/構図=中央配置/制約=文字なし、人物なし)を 1 つ作って主題だけ差し替える。Canva AI で文字乗せまで含めて 7-10 分で完成
- 所要時間:30 分 → 7-10 分の体感
- 最初の壁:1 要素ルールを守る。記事のテーマを 1 つの主題に絞るのが難しい場合は、記事の H1 を 1 行で要約してからその要約を 1 単語に縮めると主題が決まりやすいです
⑤ エンジニア——UI モックの対話的微調整
- Before:UI モックを Figma で 30 分かけて作る、または UI デザイナーに依頼して数日待つ
- After:DALL-E 3 (ChatGPT) に 4 要素モデルで投げて → 「もう少し余白を増やしてほしい」「ボタンを丸くしてほしい」と対話で 2-3 ターン微調整 → 10 分で議論用のラフが完成。完成版は Figma で詰めるが議論の入口に AI モックを使うことで、デザイナーとの認識合わせが速くなります
- 所要時間:30 分 → 10 分の体感(議論用のラフ段階まで)
- 最初の壁:対話的微調整の「次の一言」を考える語彙を貯める。「余白を増やす」「角を丸く」「色味をやわらかく」のような UI 語彙を、最初の 1 ヶ月で 10-15 個貯めると対話が回り始めます
5 つのユースケースに共通すること
5 本のユースケースに共通するのは、**「最初の壁は技術ではなく、4 要素モデルで自分の意図を言語化する語彙」**ということです。技術的なハードル(環境構築・コマンド操作)は UI ベース 6 ツールでほぼゼロですが、「自分が欲しい画像をテキストで表現する語彙」が最初の壁になります。語彙は 3 枚生成して 1 番マシを選ぶ運用を 1 ヶ月続けるだけで自然に貯まります。「これをやれば誰でも稼げる」「すぐに 3 倍生産性が上がる」のような断定はしません。私自身も最初の 1 ヶ月は思った通りの画像が出ないことが多かったですが、3 ヶ月続けたあたりから「狙い通りの画像が 5 分で出る」感覚になりました。続けるかどうかは読者の方の業務量と必要性で判断してください。職種別の AI 活用は、AI 業務効率化 ツール や AI 業務効率化 事例 も合わせて読むと、画像生成と他の業務効率化のつながりが見えてきます。
商用利用と著作権の最終判断——プロンプト面の追加注意
📖 この章で使う用語
- 著作権:作品を作った人に発生する「使う権利を管理できる」法的な権利のこと(第14本目 セクション 7 でも触れています)。
- アーティスト名指定:「○○風」のように、特定のアーティストのスタイルをプロンプトで指定すること。
ここは本記事で最も慎重に書く章です。商用利用と著作権の最終判断は、第14本目の セクション 7 で確立したメタ否定スタンスを維持しつつ、プロンプト面で追加の注意を整理します。「絶対に商用利用 OK」「絶対に著作権侵害になる」とは断定しません。最終的な判断は法務・弁護士など専門家にお任せください、というのが本記事のスタンスです。
総論はAI 画像生成 無料 で書いているので、本章ではプロンプト面の追加注意 4 点に絞ります。
① 特定の人物・キャラクター・商標名をプロンプトに入れない:実在の人物名・著名キャラクター・特定の商標をプロンプト文字列に直接入れないことを徹底しています。「〇〇さん風」「△△キャラ風」「××ブランドの製品」のような指定は、肖像権・著作権・商標権の論点に直結するため、業務利用・個人利用問わず避けています。
② 「○○風」のアーティスト名指定はリスクが大きい:「ピカソ風」「宮崎駿風」のような特定アーティストのスタイル指定は、一般論として権利の論点を伴います。生きているアーティストかどうか、著作権が切れているかどうか、各国の法律で扱いが違うかどうか、など複数の論点が絡みます。私自身はアーティスト名指定は使わず、代わりにスタイル要素を抽象的な具体名詞(「水彩画調」「フラットデザイン」「ピクトグラム調」など)で書くようにしています。
③ 実在企業ロゴ・有名キャラクターの生成依頼は避ける:実在の企業ロゴ・有名キャラクター・特定のブランドロゴを生成するプロンプトは書きません。「ロゴなし」「実在ブランドなし」を 4 要素モデルの制約要素に必ず明示することで、AI が勝手にロゴを描いてくる現象を予防しています。
④ 生成後の画像が偶然似てしまった場合の対処:プロンプトでは避けたつもりでも、生成結果が偶然、特定の人物・キャラクター・ロゴに似てしまうことはあり得ます。万一そうなった場合は速やかにその画像を削除し、必要に応じて法律の専門家にご相談ください。本記事は法律相談ではないので、対処の詳細は専門家にお任せします。
aikun の運用ラインまとめ
第14本目 セクション 7 で書いた運用ラインを、本記事のプロンプト面の追加注意と合わせて再整理します。
- 対象範囲:自分のブログのサムネ/資料イラスト/UI モック/模式図に限定
- 避ける領域:実在の人物・著名キャラクター・特定商標を含むプロンプトは書かない
- スタイル指定:アーティスト名指定ではなく、一般的なスタイル名詞(フラットデザイン/水彩画調 など)を使う
- 制約要素:「文字なし/実在ブランドなし/著名キャラなし」を 4 要素モデルの制約として明示
- 業務での利用:必ず情シス・法務・コンプラ部門の事前確認を経る
これは私個人の運用例であって、読者の方に同じ運用を求めるものではありません。最終判断は読者ご自身と専門家でお願いします。本記事は法律相談に代わるものではなく、最終的な判断は法務・弁護士など専門家にお任せください。
第14本目との関係と次の一歩
📖 この章で使う用語
- (本章では新たに導入する用語はありません)
本記事とAI 画像生成 無料の役割分担を明示しておきます。
- 第14本目「AI 画像生成 無料」:UI ベース 6 ツールの俯瞰/無料枠の前提/用途別の 1 行マップ/商用利用と著作権の総論
- 本記事「AI 画像生成 プロンプト」:プロンプトの 4 要素モデル/用途別のプロンプト型/失敗パターン/調整チェックリスト/プロンプト面の権利配慮
サムネ作成のステップ手順は第14本目 セクション 5 で書いていて、本記事はプロンプトの 4 要素テンプレに集中する形で重複を避けました。両方の記事を読んでいただくと、ツール選びとプロンプト技法がセットで揃います。
読者の段階分け
第14本目から継承している段階分けを本記事でも維持します。
- 段階 1:とりあえず無料で試す(AI 画像生成 無料)
- 段階 2:プロンプトで細かく制御する(本記事「AI 画像生成 プロンプト」)
- 段階 3:ローカル環境で大量生成する(さらに別記事候補、業務で実際に使っているもので書ける時期が来たら執筆)
段階 1 を飛ばして段階 2 から入ることもできますが、ツール選びと無料枠の前提が頭に入っていない状態でプロンプトの 4 要素モデルから入ると「結局どのツールで試せばいいか」が見えにくくなる可能性があります。第14本目を未読の方は本記事の前後で目を通すのがおすすめです。
関連トピックへの送り:ChatGPT 経由で DALL-E 3 を触りたい方は ChatGPT 始め方 が入口になります。Claude エコシステム・業務効率化のツール俯瞰・職種別の AI 活用事例は、末尾の関連記事ブロックからどうぞ。
AI 画像生成のプロンプトは、4 要素モデルを 1 つ覚えれば用途別のテンプレを 4-5 個作るだけで業務日常の 8 割が回ります。呪文集を 100 個暗記する前に、まず型で 1 枚出してみる、というのが私のおすすめです。
よくある質問
Q1: プロンプトは日本語と英語、どちらで書くのが正解ですか?
A. 日常用途では日本語で十分です(DALL-E 3、Gemini Image、Canva AI、Microsoft Designer は日本語精度がかなり高い、AI 画像生成 無料 も参照)。私自身は日本語で書くことが多く、英語にすべきと一般論として言われるのは Adobe Firefly や中上級者向けツール(Midjourney など)の場合です。日英切替は私の業務常用ではないので、断定はしません。一般論として「日本語で当たらないときは英語を試す」のは知られているテクニックです。
Q2: 「呪文集」を覚える必要はありますか?
A. 個人的には覚えなくて大丈夫だと思います。本記事の 4 要素モデル(主題 × スタイル × 構図 × 制約)で型を作っておけば、用途ごとにテンプレを 1 つずつ持つだけで業務の 8 割は回る体感です。呪文集の暗記より 4 要素モデルで型を作る方が応用が利くと感じます(個人差はあります)。
Q3: ネガティブプロンプトって何ですか?必要ですか?
A. ネガティブプロンプトは「これを画像に入れないでほしい」を AI に伝えるための、Stable Diffusion 系の中上級者向けの仕組みです。本記事で扱う UI ベース 6 ツール(DALL-E 3 / Microsoft Designer / Bing / Gemini Image / Adobe Firefly / Canva AI)では、4 要素モデルの「制約」要素にプロンプトの文章で「文字なし」「人物なし」と書けばネガティブプロンプトの代わりになります。私自身は UI ベース 6 ツールで日常運用しているのでネガティブプロンプト機能そのものは使っていません。
Q4: 思い通りの画像が一度も出ないのですが、どうすればいいですか?
A. 私自身も最初の数ヶ月はそうでした。本記事 セクション 9 の調整チェックリストの最初の 2 ステップ(3 枚生成して 1 番マシなものを選ぶ/ツールを切り替えて出し直す)だけ徹底すれば業務日常の 8 割は回ります。1 発で完成を目指さない、1 ツールに固執しない、この 2 つだけで楽になります。残りの 2 割は 4 要素モデルで欠けている要素を補う、日英切替や抽象語の具体化(一般論として知られているテクニック)を試す、で対処してみてください。
Q5: プロンプトを保存・再利用する仕組みはありますか?
A. ツールごとに「履歴機能」があります(ChatGPT は会話履歴、Microsoft Designer は My Designs 等)。私自身は、サムネ用・OG 画像用・資料イラスト用・UI モック用の 4 要素モデルテンプレを 1 つずつメモアプリ(Notion 等)に保存しておいて主題だけ差し替えて使い回す運用をしています。1 つの記事から始めて、テンプレが貯まると 2 投稿目以降が速くなります。
私自身、現職で生成AIエンジニアとして AI 画像生成を業務と個人の両方で日常的に触っている立場から、UI ベース 6 ツール向けのプロンプト 4 要素モデル(主題×スタイル×構図×制約)の実体験と、Midjourney / Stable Diffusion など中上級者向けツール群の公開情報からの概論レベルの紹介を、実体験ベースか公開情報ベースかを分けて書きました。料金体系・無料枠の上限・商用利用条件は変動するため、実際の利用判断は最新の公式情報と利用規約、社内ルールを優先してください。本記事に対する質問・誤りのご指摘は send@bon-bon-tools.com までお願いします。
関連記事
- AI 動画生成 自動化——自前パイプライン(AivisSpeech + ffmpeg + Claude Code 7 サブエージェント)で動画生成を自動化する実装記
- ChatGPT 始め方——10 分で動かせる最短ルート
- ローカルLLM 小説の現実——4 ブロックのプロンプト型を小説生成に応用するときの留意点まで整理
- AI 画像生成 無料——UI ベース無料 6 ツール整理
- AI 動画生成 おすすめ——2 系列と用途別の選び方を整理しました
- LLM とは何か——日常のたとえで整理
- AIエージェントとは何か——日常のたとえで丸ごと整理しました
- Claude 使い方——3 兄弟整理を丸ごと
- RAG とは何か——日常のたとえで整理
- エンジニア 転職 未経験——3 段階のキャリアパス整理
- SES やめとけと検索したあなたへ——入口・地雷・出口整理
- AI 業務効率化 ツール——7 種を目的×職種で整理しました
- AI 業務効率化 事例——5 領域×5 職種で整理しました
- AI コーディングとは何か——3 つのレイヤーで読み解く実務ガイド
- Claude Opus とは何か——4.5 / 4.6 / 4.7 とモデル使い分け整理
- AWS Bedrock とは何か——直 API との料金比較・Claude Code 連携・AgentCore まで整理
- AI コードレビューとは何か——プロンプト 5 型・主要 7 ツール・ローカル LLM まで丸ごと整理
- Claude Code Action とは——GitHub Actions に Claude Code を組み込む公式ハーネス
- Claude Opus と Sonnet の違い——3 モデル使い分けと 5 軸比較整理
- Dify 使い方——4 アプリタイプ俯瞰・初心者 5 ステップ・RAG 構築まで
- 生成AI 入門——5 ペルソナ別 30 日学習プランで通貫整理
- Claude Sonnet 4.6 とは——直 API / Bedrock / GitHub 統合の 3 経路と Opus / Codex 系比較を整理
- LLM ローカル——Apple Silicon Mac で Ollama を動かす個人検証視点の整理
- Claude Skills とは何か——SKILL.md / 自作 3 系統 / Slash commands・MCP・Tools との違いを整理
- Azure OpenAI Service とは何か——GPT/Codex モデル一覧・料金・直 API/AWS Bedrock 3 経路使い分け・「Azure に Claude はない」誤解まで整理
- AIエージェント × MCP——標準仕様の手と目を増やす設計(自作 MCP サーバー本番運用者が整理)
- Claude Skills を自作する——SKILL.md の書き方から業務 3 系統・チーム配布まで「作る側」を実演
- Vibe coding とは——感覚で AI に書かせ、人間はレビューと方向づけに回る新スタイルを業務実践視点で整理
- Codex CLI とは——OpenAI 系の Claude Code 相当を、両方触った現役の生成AIエンジニアが比較しながら整理しました
- Vertex AI とは——Google Cloud の AI 基盤。Gemini と Claude on Vertex の二本柱・料金・3 基盤比較を業務試用視点で整理
- MCP サーバー 作り方——Python/TypeScript SDK で自作し本番運用まで「作る側」の完全マニュアル
- Gemini CLI 使い方——Google のターミナル型 AI コーディングを 3 ツール比較で整理
- Gemini API 使い方——コードから Gemini を呼ぶ最小サンプルを Python・GAS で
出典
- aikun プロフィール §2-2「AI 画像生成」プロンプト型(主題×スタイル×構図×制約の 4 要素モデル、2026-05-15 確認済、本記事第15本目用に拡張)
- aikun プロフィール §1「キャリア年表」(営業 7 年→未経験 SE→自社開発、2026-05-13 確定、2026-05-15 参照)
- aikun プロフィール §4「キャラクター・強み」(営業時代の経験、2026-05-13 確定、2026-05-15 参照)
- 親記事:AI 画像生成 無料(第14本目)(2026-05-15 公開、本記事との役割分担および商用利用論点の総論として参照)
- UI ベース 6 ツール公式サイト(料金体系・無料枠・商用利用条件は変動するため、最新は必ず公式で要確認、いずれも 2026-05-15 取得)
- OpenAI / ChatGPT / DALL-E 3:https://openai.com/
- Microsoft Designer:https://designer.microsoft.com/
- Bing Image Creator:https://www.bing.com/create
- Google Gemini:https://gemini.google.com/
- Adobe Firefly:https://firefly.adobe.com/
- Canva:https://www.canva.com/
- 中上級者向けツール(公開情報からの概論レベルの参照、業務で実際に使っているものではない、いずれも 2026-05-15 取得)
- Midjourney 公式:https://www.midjourney.com/
- Stability AI(Stable Diffusion)公式:https://stability.ai/