テキストから画像を生成するモデルを、特定のオブジェクトの画像(3〜5枚程度)でファインチューニングすることによって、テキストで指定して特定のオブジェクトを画像生成できる Dream Booth という技術を紹介したブログの内容を試してみました。
用意した画像は安定のクロネコ様。正方形を用意する必要があるとのことでしたので、512 x 512の画像にトリミングしました。
学習はGoogle Colabで約30分ほどかかりました。まずは呪文に指定したオブジェクト名のみで生成してみます。
アゴとお胸にある白い部分の再現性が高かったです! 次は呪文を工夫して少し遊んでみました。
ネコ様だらけですみません!
少ないデータで特定のオブジェクトを指定できるようになると、img2imgとはまた違った応用の可能性がありそうです。

2022/10/25 20:08
Dream Boothで特定のネコ様画像を生成してみました。



23リアクション
このブログ一覧は
メンバー投稿記事
ですメンバー登録すると、限定記事の閲覧やメンバー同士の交流、限定イベントへの参加などができます。
CDLEコミュニティサイトβ版
JDLA(一般社団法人日本ディープラーニング協会)が実施する、G検定・E資格の合格者のみが参加できる、10万人を超える日本最大級のAIコミュニティ「CDLE」の紹介サイトです。 CDLEでは、ディープラーニングの社会実装の日本代表として、社会を発展させるエバンジェリストたちが集まり、学び合い・アウトプットする場を提供しています。
詳細を見るCDLEメンバー
¥55/月(税込)
登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。もっとみる閉じる
登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。



23リアクション
メンバーの方はこちらからログイン



