Blog

プログラミング知識0の初心者が画像生成AIでジュエリー着用画像を作ってみました / Stable Diffusion、Beautiful Realistic Asians

こんばんは。というよりはおはようございます。
最近見つけたブログで、ジュエリーの着用画像用のモデルをAIで画像生成するという記事があり、さっそく試してみました。

というのも、着用画像がないとイメージが伝わりにくいですが、
自身で撮影するのにも限界があり、また、費用面でもネックになっていました。
画像生成AIなら無料で無限にイメージ画像が作れるなんて・・・
すごいじゃんと思い、取り組んでみました。

プログラミング知識もまったくなく、Google colabとは?Pythonってなあに。。。
というところからスタートしましたが、昨今はブログやYoutubeで丁寧に指導してくださる方々がいらっしゃるので、なんとか理解し生成までできました。

私の理解と方法を簡単にまとめると、
①Google Colabを契約
ここがプログラミングコードを実行してくれる場所となるようです。
有料版でないと使用したい画像生成ソフトが使用できないので注意。

②Stable Diffusionという、画像生成ソフトを起動するためのソフトを
Google Clabでインストール
これは実行コードが配られている&結構解説されているので、実行コードを検索し
Google Driveにコピー、実行。
簡単に実行できるコードがGit Hubというサイトに集められていて、そこから初心者向けなものをコピーしました。
Automathic1111というコードでBeautiful Realistic Asians – v7を使用したかったのですが、
なんかよくわかんないけどできなかったので、X(Twitter)でみかけたUntitled0.ipynbというコードでBeautiful Realistic Asians – v5を使用しました。
アジア人の実写っぽい画像生成に強いソフト。

なんかバグなのかな?わかんなかった・・・
v5でも使用できれば一旦よし。

③Stable Diffusionで使用したいソフトBeautiful Realistic Asians – v5をUntitled0.ipynbのコード内に記載、有効化して実行
プログラミング知識がなく苦労しました。ネット検索しまくってそれっぽいコードをもらってきて、トライアンドエラーでした。
コメントアウトの意味もわからなかったけど、少し成長したかな。

④Stable Diffusionを起動

⑤Chat GPTに画像生成用のプロンプト(呪文)を書いてもらう
Chat GPTのプラグインを使用し、で画像生成用のプロンプトを書いてもらいます。
プラグインは、Photorealisticを使用。
プロンプトというのは画像生成の指示をAIに出すもので、同じプロンプトでも違う画像が生成されます。
希望のプロンプトと、ネガティブプロンプトというしてほしくない指示も記載可能。
なんとなくですが、ここの指示が多くなるとAIも混乱するようで忘れがちに。
新人教育の気分でした。笑
プロンプトは、先に記載した方を強く守る傾向にあるようです。全部そうなるわけではないですが。

⑥生成してもらったプロンプトをStable Diffusionのプロンプト枠に記載し画像を生成。

ここまできてやっと画像生成ができました。
私は②でつまづいていたので、多分v7のアップデートにネットにあったコードがまだ対応してなかった?タイミングだったのもあり
手探りで8時間ほど格闘してようやっと生成できるようになりました。

<結果はこちら>

なかなか良い感じなのではないでしょうか!!
AIはどうも手とか指の生成は苦手なようで、よく見ると指が6本あったり、
関節が5個あったりちょいグロな画像もたくさん生成されたのですが、
たまに成功します。

⑦Stable Diffusionにも拡張プラグインがあり、
その中のdepth libraryを使用することでパーツの修正ができます。
そのほかにもポーズ指定をしたり、生成された画像から修正することも可能なようなので
ここはまた試していきたいと思っています。

⑧生成した画像とPhotoshopを使って念願の着用画像を作成。

結構自然になったのではないでしょうか。
そもそものAI画像生成の際にジュエリー写真を読み込ませておいて
生成したモデルさんに合成できればいいんですけどね・・・
背景の合成とかはそちらでできるようですが、探してもあまり出てこなかったので
Photoshopのが早そうです。

これ自分の好みがもろに出てちょっと恥ずかしい気もしますけど、、
ちょっと口を開けている画像が多いので、Depth Libraryで修正しようかな・・
服装の指定なんかもできるのですが、露出多めの画像が多かったです。
ネガティブプロンプトに入れる言葉もあまり浮かばず、何度がガチャですね。

かかった費用はGoogle Colabの有料会員費とChat GPTの有料会員費で
だいたい4,500〜5,000円くらい。
Chat GPTの有料3,000円くらいで高いので、気に入ったプロンプトを1カ月で見つけて
退会しようと思ってます。Colabは1,700円くらいだったからまあいっか。

10年前のMac book Airと楽天モバイルのテザリングのみでも
どうにかなりましたけど、いい加減家にWi-Fiひこうかなと思いました。
パソコンもねえ。。。CADと画像生成用に、スペックいいWindows欲しいです。

みんな可愛い❤️

おすすめ

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です