Stable Diffusion

すてーぶるでぃふゅーじょん

生成AI

意味・定義

テキストから高品質な画像を生成できるオープンソースの拡散モデル。

解説

Stable Diffusionは、テキストから画像を生成するAIモデルです。2022年8月にオープンソースで公開され、誰でも無料で使えることから、爆発的に普及しました。 Stable Diffusionの最大の特徴は、オープンソースであることです。MidjourneyやDALL-E 3は商用サービスですが、Stable Diffusionは自分のPCにインストールして、無制限に画像を生成できます。また、モデルのカスタマイズも自由で、特定のスタイルやキャラクターを学習させられます。技術的には、拡散モデル（Diffusion Model）を使っています。ランダムなノイズから始めて、徐々にノイズを除去しながら画像を生成します。このプロセスを制御することで、多様なスタイルの画像を作れます。コミュニティが非常に活発で、Civitaiなどのプラットフォームで、数万種類のカスタムモデル（Checkpoint）やLoRAが共有されています。アニメ風、リアル写真風、油絵風など、あらゆるスタイルのモデルが揃っています。

使い方・例文

"イラストレーターは、Stable Diffusionでラフスケッチを生成し、それを基に仕上げることで、作業時間を大幅に短縮しています。また、複数のバリエーションを瞬時に生成できるため、クライアントに提案する選択肢を増やせます。ゲーム開発では、背景画像、キャラクターデザイン、アイテムのアイコンなどを生成します。特にインディーゲーム開発者にとって、専門のアーティストを雇わずに高品質なアセットを作れるのは大きなメリットです。マーケティングでは、SNS投稿用の画像、広告バナー、商品のモックアップなどを短時間で作成しています。"

Stable Diffusion

意味・定義

解説

使い方・例文

関連語

関連記事

敵対的生成ネットワーク

拡散モデル

DALL-E

Midjourney