テキストから画像(txt2img)を生成するAI「Stable Diffusion」が2022年8月に公開され注目されました。
注目されたのは、高度な画像生成AIの同様モデルでソースコードが公開されているものがなく、オープンソースで公開され誰でも使え、商用利用もできるようになったことです。
画像から画像(img2img)を生成することもできます。
AIに指示するテキスト等を作成するプロンプトエンジニアリングという職種も存在し、求人もあるようです。
「Stable Diffusion」を使用する方法として、自分のPCにインストールすることもできますが、NVIDIA製GPUが必要であるなどの制約があります。
既に「Stable Diffusion」を使用しリリースされているスマートフォンアプリやWebサービスを利用すれば、手軽に画像生成AIを体験することもできます。
今回、「Google Colaboratory」に「Stable Diffusion」の環境を構築して試しました。
思うような画像を生成するためのテキスト作成には、コツ(スキル)が必要と感じましたが、AIが簡単に画像を生成してくれます。
様々なサイトで紹介されているので、興味のある方はネット検索して見てください。
画像生成に限らずAI関連は凄まじいスピードで進化しており。私たちのどのような恩恵をもたらしてくれるか楽しみです。
以下は、今回構築した環境の「Stable Diffusion」で作成した画像です。
テキスト「best high quality landscape, Beautiful contrast between the sunrise and Manhattan, by Craig Mullins」 | テキスト「best high quality landscape, in the morning light, Overlooking HONOLULU beautiful city with Diamond Head, from a Tantalus Lookout, by greg rutkowski and thomas kinkade, Trending on artstation makoto shinkai style」 |