DALL-E3とは?ChatGPT・Bingと連携した画像生成AIの使い方を解説
機能だけでなくユーザビリティも向上!高度なプロンプト対応でより複雑な画像生成が可能に。
「Stable Diffusion」や「Midjourney」をはじめ、これまでに数々の画像生成AIが登場しています。
画像生成AIの進化は現在も続いており、2023年9月21日にはOpenAI社がChatGPTに「DALL-E3」という画像生成AIを追加すると発表しました。
この「DALL-E3」はどのような特徴を持つ画像生成AIなのでしょうか。
本記事では、DALL-E3の概要や使い方を実際のプロンプト例とともに解説しますので、ぜひご覧ください。
創業手帳では、ChatGPTの可能性についてまとめた「ChatGPT 生成AIガイド」をリリース!ChatGPTと専門家との対決や、いくつかの生成AIで同じお題で画像を作らせてみたなど、面白い企画が満載!無料でお読みいただけますので、是非あわせてご活用ください。
※この記事を書いている「創業手帳」ではさらに充実した情報を分厚い「創業手帳・印刷版」でも解説しています。無料でもらえるので取り寄せしてみてください
この記事の目次
DALL-E3とは
「DALL-E3」とは、OpenAI社がChatGPTに追加すると発表した画像生成AIです。
DALL-E3は「ダリ・スリー」という読み方で、「DALL-E2」の最新バージョンという位置付けになっています。
非常に簡単に使用でき、プロンプトを入力するだけで指示に沿った画像が生成されます。
これまでの画像生成AIでは質の高い画像を出力するためには、複雑なプロンプトが求められていました。
しかし、DALL-E3では簡単なプロンプトでも質の高い画像が生成されます。
また、高度なプロンプトにも対応しているため、生成された画像の微調整も可能です。
日本語にも対応しており、これからどんどんと利用者が増加していくことが予想されます。
DALL-E3はどのように画像を生成している?
DALL-E3では学習した膨大なデータに対してアルゴリズムを適用し、画像を生成しています。
このアルゴリズムは「テキストによるプロンプトを理解し画像を生成する」ことが設計されています。
DALL-E3で生成される画像には多様性があり、同じプロンプトでもさまざまな画像が生成されます。
画像の生成後にはユーザーの指示によって画像を修正していきますが、DALL-E3はこの反復によっても生成クオリティを向上させています。
なお、DALL-E3には「Transformer」というAIモデルが採用されています。
「Transformer」は初期段階で特別な知識を持っていなく、特定領域のデータを学習する過程で画像生成能力を確立していきます。
「Transformer」は意味のある情報のみを学習していくという特性によって、画期的なクオリティの向上を実現したといわれています。
DALL-E3を利用する2つの方法と料金
DALL-E3の前バージョンであるDALL-E2は、専用のサイトからしか利用できませんでした。
しかしDALL-E3は「ChatGPT」・「Bing」2つの方法で利用できるようになっています。
以下では、DALL・E3を利用する2つの方法と料金を紹介します。
【有料】ChatGPTでDALL-E3を使う方法
DALL-E3はChatGPT内で利用可能です。
ただし、DALL-E3を利用するためには、ChatGPTの有料版である「ChatGPT Plus」または法人版の「ChatGPT Enterprise」に加入する必要があります。
個人で利用する場合には「ChatGPT Plus」への加入が必要になるため、月額20ドルの料金がかかります。
「ChatGPT plus」にログインすると「GPT3.5」と「GPT4」どちらを利用するか選択できる画面になります。
そこで「GPT4」にカーソルを合わせると、DALL-E3が選択できるようになっています。
DALL-E3にチェックを入れたら、下部のチャット欄にプロンプトを入力するだけでDALL-E3が利用できます。
【無料】BingでDALL-E3を使う方法
DALL-E3は、Bingでも利用可能です。
ChatGPTとは異なり無料で利用できますが、生成した画像を商用利用することができませんので注意しましょう。
BingからDALL-E3を利用する際には「Bing Image Creator」にログインします。
上部に「提供 DALL-E3」とあるように、すでにDALL-E3が適用された状態のため、検索バーにプロンプトを入力するだけで利用できます。
DALL-E3の使い方とプロンプト例
実際に「ChatGPT Plus」を利用して、DALL-E3の使い方とプロンプト例を解説します。
今回は「欠伸している猫」というプロンプトを最初に入力してみました。
すると上記のように2枚の画像と、その画像に沿ったプロンプトがかえってきました。
リリース当初は4枚の画像が生成されていたようですが、現在(2023年11月1日)は2枚の画像が生成されるようになっています。
1つのプロンプトでまったくイメージの異なる画像が生成されたので、自分のイメージに近い画像について微調整を重ねてみましょう。
続いて「左の画像の猫の毛を短くしてください」というプロンプトを入力しました。
すると上記のように、テイストを変えずに毛が短くなった猫の画像が生成されたため、指示が成功したことが推察できます。
そのほかにもさまざまな指示が可能ですので、簡単なプロンプトの例をいくつか紹介します。
<プロンプト例>
- 横長に:「横長で作成してください」「生成した画像を横長にしてください」
- 縦長に:「縦長で作成してください」「生成した画像を縦長にしてください」
- テイスト指示:「ポップ」「クール」「ナチュラル」
- 画像中にローマ字を入れる:「AIという文字を入れてください」
- 人の描写:「黒髪の日本人男性の画像を作成してください」
- ロゴ:「〇〇をモチーフにしたロゴを作成してください」
現時点では作成できる画像の縦横比は3種類のみのようですが、デザインやテイストに関しては非常に自由度が高いです。
調整は何度でも可能なため、少しずつイメージに近づけていくことで、実務上でも利用可能なレベルの画像が生成できるでしょう。
もう一つ例として「起業をモチーフにしたロゴを作成してください」というプロンプトを入力してみました。
すると下記のような画像が生成されましたが、スペルの間違いがあります。
かなり細かいデザインのため、修正していけばそのまま使えるレベルになりそうですが、スペルミスなど完璧でない部分もみられます。
また「創業手帳」というロゴを漢字を含めて作成してくださいというプロンプトを入力してみたところ、以下のようなロゴが生成されてました。
残念ながら、漢字を含めての画像生成はまだ難しいようです。
簡単なプロンプトでもある程度のクオリティを求めることができますが、一定以上のクオリティを求めるならば、やはり高度なプロンプトを作成する必要がありそうです。
DALL-E3は商用利用可能?著作権問題について
DALL-E3で生成された画像は、商用利用可能です。
(BIngの場合には不可)
生成した画像の著作権はユーザーに帰属するため、著作権の問題もクリアしています。
しかし、どんな画像でも作成できるわけでなく、DALL-E3にはいくつかの制限が設けられています。
たとえば、著作権がすでに確立されているオリジナルキャラクターなどは、プロンプトを入力しても画像を作成してもらえません。
試しに「ポケモンのピカチュウの絵を描いてください」と入力したところ以下の回答がかえってきました。
(和訳:申し訳ありませんが、ポケモンのピカチュウのような著作権のある画像を作成することはできません。しかし、電気をテーマにしたユニークなクリーチャーをデザインしたり、その他のお手伝いをすることは可能です。ご希望をお聞かせください!)
また、暴力的なコンテンツやアダルトコンテンツの生成についても制限があるようです。
画像生成AIの登場によって、特定のアーティストの絵や画像に似ている事例が多発している問題があり、アメリカでは訴訟も起こっていました。
このような著作権周りの問題は画像生成AIの利用にあたって、これからも重要なテーマとなるでしょう。
その点について、DALL-E3だけでなくDALL-E全体としては、上記のように著作権の問題をクリアにできるような学習が行われているようです。
また「Artist and Creative Content Owner Opt Out」ページでは、クリエイターやアーティストが特定の画像をDALL-Eの学習過程から除外するリクエストができるようになっています。
これらの対応によって、DALL-E3はより安全に責任を持って利用可能なツールに近づいています。
ただ、すべての問題が解決できているわけではないため、著作権周りの問題についてはこれからも議論が続けられていくでしょう。
DALL-E3の使い道やもたらす影響
DALL-E3は、これまで紹介してきたように簡単に画像が生成できる有用なAIツールです。
画像生成AIが社会にもたらした影響は大きく、DALL-E3についてもこれからさまざまな影響を与えていくことが予想されます。
たとえば、DALL-E3の使い道として下記のことが考えられます。
<DALL-E3の使い道>
- 図解などプレゼン資料への活用
- 広告クリエイティブの作成
- ロゴ作成
- アイキャッチ作成
- 作品のアイデア出し
- 服のデザイン作成
- キャラクターデザインの作成 など
とくにビジネスの世界ではスピード感が大切になるため、広告クリエイティブが短時間で作成できる点などは、有用な使い道となるでしょう。
クリエイティブ業界の人にとって生成AIは脅威になり得る存在ですが、上手に使いこなすことができれば創作活動を支える強力なツールにもなり得るでしょう。
たとえば作品のアイデア出しなどは良い例です。
DALL-E3によって簡単にイメージを固め、そこから自分のオリジナリティを追加していくことができればそれは独自の作品になります。
実際、画像生成AIを利用したクリエイターも登場しているため、これからはより強くAIを使いこなしていくことも求められるでしょう。
DALL-E3の展望と倫理的懸念
DALL-E3はChatGPTに組み込まれたことで、機能だけでなく、ユーザビリティも大幅に向上させています。
ただ、本記事でも触れたようにスペルを間違ってしまうなど、まだまだAIの技術は発展段階にあるでしょう。
しかし、すでに社会に与えている影響は大きく、利用者の増加に伴ってこれからも増大していくことが予想されます。
このような状況のなかで、私たちは著作権や倫理的な問題を考え続けていく必要があるでしょう。
現状では、AIが生成した画像が倫理的に不適切な表現を含んでいる可能性があります。
そのため、AIにすべてを委ねることは危険で、ユーザー側には管理や制御が求められるでしょう。
ユーザーは、人だから持てる倫理観を忘れずに、画像生成AIを利用していかなければなりません。
DALL-E3が与える影響や効果を、どのように利用し制御していくのかは今後大きなトピックになりそうです。
新しい画像生成AI「DALL-E3」を使いこなそう!
ここまで「DALL-E3」について概要や利用方法・今後の展望などを紹介してきました。
DALL-E3はChatGPTに組み込まれたことで、ユーザービリティを大きく向上させ、多大な影響を社会に与えています。
機能についても大きな向上が見られ、実際に「ChatGPT plus」からDALL-E3を使ってみましたが、従来の画像生成AIよりも簡単に使うことができました。
ユーザーが適切に使いこなすことができれば、さまざまな使い道が見出せるはずです。
本記事を参考に、画像生成AIの利用を検討し、DALL-E3を使いこなしましょう!
本記事とあわせて「ChatGPT生成AIガイド」を読めば、生成AIの活用のヒントになるはず!詳細は上のバナーをクリック!
(編集:創業手帳編集部)