DALL-E3とは?ChatGPT・Bingと連携した画像生成AIの使い方や商用利用についてなど解説
機能だけでなくユーザビリティも向上したDALL-E3!高度なプロンプト対応でより複雑な画像生成が可能に
「Stable Diffusion」や「Midjourney」をはじめ、これまでに数々の画像生成AIが登場しています。
画像生成AIの進化は現在も続いており、2023年9月21日にはOpenAI社がChatGPTに「DALL-E3」という画像生成AIを追加すると発表しました。
この「DALL-E3」はどのような特徴を持つ画像生成AIなのでしょうか。
DALL-E3を使いこなせれば、業務効率化や生産性向上を図れます。デザインスキルがない方でも簡単にクオリティの高い画像を作成できるため、事業主の方が知っておいて損することはありません。
本記事では、DALL-E3の概要や使い方を実際のプロンプト例とともに解説しますので、ぜひご覧ください。
創業手帳では、ChatGPTの可能性についてまとめた「ChatGPT 生成AIガイド」をリリース!ChatGPTと専門家との対決や、いくつかの生成AIで同じお題で画像を作らせてみたなど、面白い企画が満載!無料でお読みいただけますので、是非あわせてご活用ください。
※この記事を書いている「創業手帳」ではさらに充実した情報を分厚い「創業手帳・印刷版」でも解説しています。無料でもらえるので取り寄せしてみてください
この記事の目次
DALL-E3とは?読み方と特徴を解説
「DALL-E3」とは、OpenAI社がChatGPTに追加すると発表した画像生成AIです。
DALL-E3は「ダリ・スリー」という読み方で、「DALL-E2」の最新バージョンという位置付けになっています。
非常に簡単に使用でき、プロンプト(指示文)を入力するだけで指示に沿った画像が生成されます。「AIに理解してもらえるプロンプトを作るのが苦手」という方でも、問題なく使いこなせるでしょう。
これまでの画像生成AIでは質の高い画像を出力するためには、複雑なプロンプトが求められていました。しかし、DALL-E3では簡単なプロンプトでも質の高い画像が生成されます。
また、高度なプロンプトにも対応しているため、生成された画像の微調整も可能です。一度生成された画像に対して、細かい修正を指示すればイメージに近い画像を生成できます。
日本語にも対応しており、これからどんどんと利用者が増加していくことが考えられるでしょう。
DALL-E3はどのように画像を生成している?
DALL-E3では学習した膨大なデータに対してアルゴリズムを適用し、画像を生成しています。
このアルゴリズムは「テキストによるプロンプトを理解し画像を生成する」設計がされており、入力されたテキストから意味や意図を読み取り、画像を生成する点が特徴です。
DALL-E3で生成される画像には多様性があり、同じプロンプトでもさまざまな画像が生成されます。
画像の生成後にはユーザーの指示によって画像を修正していきますが、DALL-E3はこの反復によっても生成クオリティを向上させています。人間の意思を反映させやすく、優秀なデザイナーがサポートしてくれているイメージを持つとよいでしょう。
なお、DALL-E3には「Transformer」というAIモデルが採用されています。
「Transformer」は初期段階で特別な知識を持っていなく、特定領域のデータを学習する過程で画像生成能力を確立していきます。
「Transformer」は意味のある情報のみを学習していくという特性によって、画期的なクオリティの向上を実現したといわれています。
DALL-E3を利用するメリット
DALL-E3を利用すれば、スムーズに画像生成を行えます。プロンプトを入力すれば数秒で画像を生成してくれるため、イメージ画像を作成する作業を効率化できるでしょう。
プロンプトを具体的かつわかりやすく入力すれば、脳内でイメージした画像を生成できます。デザインツールを用いてゼロから生成する必要がないうえに、デザインに関する専門的なスキルがなくても素早く高品質な画像を作成できる点がメリットです。
さまざまなスタイルや雰囲気の画像を短時間で生成できるため、微調整も容易です。有効活用すれば、広告を作成する際の手間と労力を大幅に削減できるでしょう。業務生産性の向上を目指す事業主の方にとって、DALL-E3は有用な存在といえます。
DALL-E3と他の画像生成AIとの違い
DALL-E3と他の画像生成AIの違いは何でしょうか?
Midjourney・Stable Diffusionとの大きな違いは日本語で利用できる点です。
また、Adobe Firefly月額料金は、プランにより異なるため、シンプルな料金体系&日本語で利用できる>DALL-E3は初心者にも大変おすすめできます。
DALL-E 3 | Stable Diffusion | Midjourney | Adobe Firefly | |
---|---|---|---|---|
月額料金 | 無料 or 月額20ドル | 無料 | 月額10ドル | 無料 or プランにより変動 |
日本語対応 | ◯ | ✕ | ✕ | ◯ |
商用利用 | 無料版✕ 有料版◯ | ✕ | ✕ | ◯ |
DALL-E3の使い方と料金
DALL-E3の前バージョンであるDALL-E2は、専用のサイトからしか利用できませんでした。
しかしDALL-E3は「ChatGPT」・「Bing」2つの方法で利用できるようになっています。
以下では、DALL・E3を利用する2つの方法と料金を紹介します。
【有料】ChatGPTでDALL-E3を使う方法
DALL-E3はChatGPT内で利用可能です。
ただし、DALL-E3を利用するためには、ChatGPTの有料版である「ChatGPT Plus」または法人版の「ChatGPT Enterprise」に加入する必要があります。
個人で利用する場合には「ChatGPT Plus」への加入が必要になるため、月額20ドルの料金(1ドル150円として日本円で3,000円)がかかる点に注意しましょう。
「ChatGPT‐4」か「GPT-4o」でログインすると、DALL-E3が利用できます。ただし、この使い方だと一度に生成できる画像が1枚です。
一度に2枚の画像を生成するには、「GPTを探す」から「DALL-E」を選んでから利用しましょう。
【無料】Bing Image CreatorでDALL-E3を使う方法
DALL-E3は、Bingでも利用可能です。
ChatGPTとは異なり無料で利用できますが、生成した画像を商用利用することができませんので注意しましょう。
BingからDALL-E3を利用する際には「Image Creator」にログインします。
右下に「Powered by DALL-E3」とあるように、すでにDALL-E3が適用された状態のため、検索バーにプロンプトを入力するだけで利用できます。
【無料】MicrosoftCopilot(旧:Bing Chat)でDALL-E3を使う方法
「Microsoft Copilot」に入り、プロンプトを入力するだけで、DALL-E3が利用できます。
こちらも生成された画像下部に、「Powered by DALL-E3」とありますので、すでにDALL-E3が適用された状態です。
DALL-E3のプロンプト例
実際に「ChatGPT Plus」を利用して、DALL-E3の使い方とプロンプト例を解説します。
今回は「欠伸している猫」というプロンプトを最初に入力してみました。
すると上記のように2枚の画像と、その画像の解説文がかえってきました。
自分のイメージに近い画像を選んで微調整を重ねてみましょう。
続いて「左の画像の猫の毛を短くしてください」というプロンプトを入力しました。
すると上記のように、テイストを変えずに毛が短くなった猫の画像が生成されたため、指示が成功したことが推察できます。このように、数回の指示を経てイメージ通りの画像をスムーズに生成してくれる点は、DALL-E3の強みです。
そのほかにもさまざまな指示が可能ですので、簡単なプロンプトの例をいくつか紹介します。
<プロンプト例>
- 横長に:「横長で作成してください」「生成した画像を横長にしてください」
- 縦長に:「縦長で作成してください」「生成した画像を縦長にしてください」
- テイスト指示:「ポップ」「クール」「ナチュラル」
- 画像中にローマ字を入れる:「AIという文字を入れてください」
- 人の描写:「黒髪の日本人男性の画像を作成してください」
- ロゴ:「〇〇をモチーフにしたロゴを作成してください」
現時点では作成できる画像の縦横比は3種類のみのようですが、デザインやテイストに関しては非常に自由度が高いです。
調整は何度でも可能なため、少しずつイメージに近づけていくことで、実務上でも利用可能なレベルの画像が生成できるでしょう。
もう一つ例として「起業をモチーフにしたロゴを作成してください」というプロンプトを入力してみました。
すると下記のような画像が生成されましたが、スペルの間違いがあります。
修正していけばそのまま使えそうですが、スペルミスなど完璧でない部分もみられます。
また「『創業手帳』というロゴを漢字を含めて作成してください」というプロンプトを入力してみたところ、以下のようなロゴが生成されてました。
残念ながら、漢字を含めての画像生成はまだ難しいようです。
簡単なプロンプトでもある程度のクオリティを求めることができますが、一定以上のクオリティを求めるならば、やはり高度なプロンプトを作成する必要がありそうです。
DALL-E3は商用利用可能?著作権問題について
DALL-E3で生成された画像は、商用利用可能です。生成した画像の著作権はユーザーに帰属するため、著作権の問題もクリアしています。
実際に、「Subject to the Content Policy and Terms, you own the images you create with DALL·E, including the right to reprint, sell, and merchandise – regardless of whether an image was generated through a free or paid credit.(コンテンツポリシーと規約に従い、無料または有料のクレジットを使用して作成された画像に関わらず、DALL・Eで作成した画像は転載、販売、商品化する権利を含め、お客様の所有となります。)」と公式ページのヘルプセンターに記されています。
引用:OpenAI ヘルプページ「Can I sell images I create with DALL·E?」
ただし、Bing AI・Bing Image Creatorで生成した画像は商用利用に関する明確な記述がありません。法的なトラブルを未然に防ぐためには、ChatGPT Plus版を利用するとよいでしょう。
しかし、どんな画像でも作成できるわけでなく、DALL-E3にはいくつかの制限が設けられています。
たとえば、著作権がすでに確立されているオリジナルキャラクターなどは、プロンプトを入力しても画像を作成してもらえません。
試しに「ポケモンのピカチュウの絵を描いてください」と入力したところ以下の回答がかえってきました。
(和訳:申し訳ありませんが、ポケモンのピカチュウのような著作権のある画像を作成することはできません。しかし、電気をテーマにしたユニークなクリーチャーをデザインしたり、その他のお手伝いをすることは可能です。ご希望をお聞かせください!)
また、暴力的なコンテンツやアダルトコンテンツの生成についても制限があるようです。
著作権侵害に関する問題は、画像生成AIの利用にあたって重要なテーマの一つといえます。
DALL-E全体としては、著作権の問題をクリアにできるような学習が行われており、今後は改善が見込まれています。
また「Artist and Creative Content Owner Opt Out」ページでは、クリエイターやアーティストが特定の画像をDALL-Eの学習過程から除外するリクエストが可能です。
これらの対応によって、DALL-E3はより安全に責任を持って利用可能なツールに近づいています。
ただ、すべての問題が解決できているわけではないため、著作権周りの問題についてはこれからも議論が続けられていくでしょう。
DALL-E3の使い道やもたらす影響
DALL-E3は、これまで紹介してきたように簡単に画像が生成できる有用なAIツールです。
画像生成AIが社会にもたらした影響は大きく、DALL-E3についてもこれからさまざまな影響を与えていくことが予想されます。
たとえば、DALL-E3の使い道として下記のことが考えられます。
<DALL-E3の使い道>
- 図解などプレゼン資料への活用
- 広告クリエイティブの作成
- ロゴ作成
- アイキャッチ作成
- 作品のアイデア出し
- 服のデザイン作成
- チラシやポスターの作成
- 書籍のデザイン
- キャラクターデザインの作成 など
とくにビジネスの世界ではスピード感が大切になるため、広告クリエイティブが短時間で作成できる点などは、有用な使い道となるでしょう。
クリエイティブ業界の人にとって生成AIは脅威になり得る存在ですが、上手に使いこなすことができれば創作活動を支える強力なツールにもなり得るでしょう。
たとえば作品のアイデア出しなどは良い例です。
DALL-E3によって簡単にイメージを固め、そこから自分のオリジナリティを追加していくことができればそれは独自の作品になります。ゼロの状態から物事を考えるのは手間と労力がかかりますが、DALL-E3を活用すればスムーズにビジネスを形にできるでしょう。
実際、画像生成AIを利用したクリエイターも登場しているため、これからはより強くAIを使いこなしていくことも求められるでしょう。
DALL-E3を活用する際の注意点
画像生成に関する業務をスマートにしてくれるDALL-E3ですが、利用にあたって注意すべき点があります。
トラブルを未然に防ぐためにも、以下で解説する内容を参考にしてみてください。
利用規約を確認する
DALL-E 3で画像生成を行う前に利用規約を確認し、遵守することが大切です。もし利用規約やコンテンツポリシーに違反すると、アカウント停止になる可能性があります。
さらに、気づかないうちに著作権侵害や知的財産権侵害を犯していると、訴訟を起こされるリスクも考えられます。結果的に企業の信頼を失ってしまう要因にもなりかねないため、注意しましょう。
AIによる生成物である事を明示する
OpenAI社の公式サイトによると、DALL·E3で生成した画像はAIが生成したことを明示することが求められています。
生成された画像には、生成された画像の識別をするための技術「C2PA」という技術が用いられています。C2PAによりディープフェイクや偽情報の拡散を防げるため、秩序を守るうえでもAIによる生成物である事を明示することが求められているのです。
実際に、海外ではAIで作成したコンテンツに関して「AIが生成したものか、オリジナルなのかを明示する」という規制が強まっています。生成AIに関して「新聞社や通信社が多大な労力とコストをかけて作成した貴重な知的財産が盗まれている」という旨の主張もあるため、日本でも今後規制が強化される可能性があります。
プロンプトが雑だと期待通りの画像生成ができない
DALL-E3はプロンプトに基づいて画像を生成するため、肝心のプロンプトが雑だと期待通りの画像生成ができません。また、プロンプトが曖昧でAIが理解できないと、期待とは異なる画像が生成されるでしょう。
結果として、何度入力してもイメージ通りの画像が生成されず、時間を浪費してしまう事態が起こりえます。つまり、効率よくDALL-E3を使うためには、人間の「指示を的確に出す能力」も求められます。色やスタイル、構図などの要素を明確に指定すると、イメージに近い画像を生成できる可能性が高まります。
なお、一度で理想通りの画像生成ができないケースがほとんどなので、その都度具体的なプロンプトを入力して再試行することが大切です。
DALL-E3の展望と倫理的懸念
DALL-E3はChatGPTに組み込まれたことで、機能だけでなく、ユーザビリティも大幅に向上させています。
ただ、本記事でも触れたようにスペルを間違ってしまうなど、まだまだAIの技術は発展段階にあるでしょう。
しかし、すでに社会に与えている影響は大きく、利用者の増加に伴ってこれからも増大していくことが予想されます。
このような状況のなかで、私たちは著作権や倫理的な問題を考え続けていく必要があるでしょう。
現状では、AIが生成した画像が倫理的に不適切な表現を含んでいる可能性があります。また、同意なく人物の画像を生成したり使用権を持たない画像をアップロードしたりして、法的トラブルに発展するリスクも完全に排除できません。
そのため、AIにすべてを委ねることは危険で、ユーザー側には管理や制御が求められるでしょう。
ユーザーは、人だから持てる倫理観を忘れずに、画像生成AIを利用していかなければなりません。「アイデア出しはAIに任せて、法令を含めた詳細な確認は人間が行う」という付き合いをすれば、倫理的にも問題なくDALL-E3を利用できるでしょう。
DALL-E3が与える影響や効果を、どのように利用し制御していくのかは今後大きなトピックになりそうです。最新技術だけでなく法律面での最新情報も確認しながら、上手にAIと付き合っていきましょう。
新しい画像生成AI「DALL-E3」を使いこなそう!
ここまで「DALL-E3」について概要や利用方法・今後の展望などを紹介してきました。
DALL-E3はChatGPTに組み込まれたことで、ユーザービリティを大きく向上させ、多大な影響を社会に与えています。
機能についても大きな向上が見られ、実際に「ChatGPT plus」からDALL-E3を使ってみましたが、従来の画像生成AIよりも簡単に使うことができました。
ユーザーが適切に使いこなすことができれば、さまざまな使い道が見出せるはずです。優秀なデザイナーを毎月3,000円程度で雇っていると考えれば、安い投資といえるのではないでしょうか。
プレゼン資料やチラシ、ポスター製作を行う機会が多い事業主の方は、本記事を参考にしながら、画像生成AIの利用を検討しDALL-E3を使いこなしましょう!
本記事とあわせて「ChatGPT生成AIガイド」を読めば、生成AIの活用のヒントになるはず!詳細は上のバナーをクリック!
(編集:創業手帳編集部)