メインコンテンツへスキップ
AnimagineXLの出力を特別なLoRAでグレードアップ!
  1. ブログ/

AnimagineXLの出力を特別なLoRAでグレードアップ!

· loading · loading ·
目次
モデルレビュー - この記事は連載の一部です
パート 4: この記事

こんにちは、Einarです。

AnimagineXLは、バージョン3.0も(バージョン3.1)[https://huggingface.co/cagliostrolab/animagine-xl-3.1]も素晴らしい出力を生み出します。でも、もし品質をさらに向上させる方法があると言ったらどうでしょう?実は、いくつかのLoRAを組み合わせることで、画像の品質を別のレベルに引き上げることができるんです。

「ありえない!」

全然ありえますよ、まやちゃん!これらのLoRAを詳しく見てみましょう!

LoRAはどのようにテストされたのか?
#

「マスター、準備万端です!」

よくやった、詠子さん。それでは、テストのセットアップを早速説明しましょう!

これらのLoRAをSD.Nextを使って個別にテストしました。SD.NextはStable Diffusionのための代替webuiです。画像はCagliostroLab(AnimagineXL 3.1の製作者)が推奨するパラメーターを使用して生成されました:サンプラーには「Euler a」、CFGスケールは7に設定、解像度は832x1216で、28ステップの生成を実行しました。高解像度補助には、20ステップで解像度を2倍にするESRGAN 4xUltrasharpアップスケーラーを使用しました。ノイズ除去強度は0.4に設定されました。

比較用に常に同じ画像を得られるように、シードは1234567890に設定されました。テストされたLoRAに加えて、great lightingのみが使用されました。

テストには、このプロンプトを使用しました:

1girl, original, (solo:1.1),  standing,  waving,  cowboy shot, athletic,
medium breasts, intricate dark brown hair, blue eyes, (bob cut:1.1),
(short hair:1.1), (blunt ends:1.2), left swept bangs,
futuristic black bracelet on right wrist,  smile, yellow t-shirt,
lowleg denim shorts, navel, groin,
detailed ultra photorealistic street of Tokyo, street, car,
crossing, traffic light, crowd, ,  great lighting,  perfect hands,
cinematic angle, detailed shadows, detailed body,  anime artwork,
anime style, key visual, vibrant, studio anime, highly detailed,
newest, late, anime coloring, masterpiece, best quality,
very aesthetic, absurdres,  <lora:great_lighting:4>

そして、FastNegative embeddingを使用したネガティブプロンプトは以下のようになります:

FastNegative, lowres, (bad), text, logo, blurry,  error,
fewer digits, extra digit, missing fingers, worst quality,
jpeg artifacts, low quality, watermark, unfinished, displeasing,
oldest, early, chromatic aberration, signature, extra digits,
artistic error, username, scan, [abstract],
photo, deformed, black and white, realism, disfigured,
low contrast, lipgloss, curly hair, parted bangs  sketch,
(nose:0.9), colored inner hair, (child, loli), (key:1.2),
blush,  key necklace, forehead, bangle, sweatband

この実験では、ADetailerも使用しました。特に、face_yolov8n.pt(ノイズ除去強度0.35)とhand_yolov8n.pt(0.25)の2つのモデルを使用しました。

Bing-su/adetailer

Auto detecting, masking and inpainting with detection model.

Python
4214
329

スタイルをさらに魅力的に: style-enhancer-xl
#

style-enhancer-xl はもともとAnimagine 2.0用に作られたLoRAで、作者によると、AnimagineXLにSD 1.5風のスタイルを取り戻すそうです。これを使ってAnimagine XL 3.1のスタイルをさらに改善しますが、最終結果に過度に影響しない程度にします。実際には、重みは0.6程度です。

これだけでもいいイラストを生成できますが、もっとよくすることができます!

細部まで鮮明に: xl_more_art-full
#

xl_more_art-fullは、より細かいディテールを増やし、生成された画像をより「芸術的」にすることを目的としたLoRAです。写実的な画像には少し向いていますが、SDXL 1.0ベースモデル(追加の変更なし)に基づいているため、Animagine XL 3.1でも問題なく機能します。このLoRAの効果は、特に背景だけでなくキャラクターにも、詳細の劇的な増加をもたらします。効果は非常に強いので、重みは約0.8を使用します。

見ての通り、まやちゃんはとてもかわいいですよね?えへん!もっと真面目に言うと、イラストが非常に詳細なので、高解像度補助のためのノイズ除去強度を下げる必要があります。そうしないと、「無意味な詳細」が大幅に増えてしまいます(例えば、このイラストのまやちゃんの顔にあるノイズを見てください)。私のテストでは、これは0.3から0.4の間に下げることを意味します。

手を貸して: Hands XL
#

手…Stable Diffusionの難敵です。過去1年間、人は手の品質を向上させようと最善を尽くしてきましたが、成功度合いは様々です。どのLoRAもこの問題を完全に解決することはできないと心に留めつつ、Hands XLは少なくとも生成される無意味な手の量を減らす(消去はしない)ことができます。これはperfect handsキーワードでトリガーされます。

このLoRAはADetailerおよびhand_yoloモデルと併用するのが最適で、初期生成を手の位置と形状に使用し、ADetailerで結果をさらに洗練させます。ここではノイズ除去強度に非常に注意する必要があり、値が高すぎると…まあ…「特殊な」手を得てしまう可能性があります。私のテストでは、ADetailerのノイズ除去強度は0.25から0.3の間が最も効果的です。

それでもまだ当たり外れがあります。ここで見ての通り、まやちゃんの手に余分な指を加えるだけでしたw

冗談はさておき、少し努力が必要ですが、少なくとも余分な指だけを心配すればよく、変形した手についてはずっと心配する必要が少なくなります。

イラストに「アニメ」を加える: Anime Face
#

Anime Face、Animagine XL 3.0の出力を向上させるために開発されたLoRAです。これはエッジライン色の彩度を扱う4つの異なるLoRAシリーズの一部です。Animagine XL 3.0と合理的にうまく機能し、3.1にも適用可能です。著者からの推奨重量は1.0です。

見ての通りです(手は気にしないでくださいね!w)、かなりいいアニメ風の「フラットカラー」を得ることができます。しかし、これは欠点となり、生成されたイラストはいくつかの詳細を失います。この問題は、明るい光の中での主題を持つイラストを生成する際に非常に明らかで、すべてが少し平坦すぎます。稀に、顔が体の残り部分と比較して明るすぎることもあります。

したがって、このLoRAは、これらの問題を補うために詳細を増やす他のLoRAと併用すべきです。

最終結果
#

最終結果

まだ終わりではありません。全てのLoRAを組み合わせてみましょう、どんな結果が出るか見てみましょう!

結果はLoRAの強みをすべてきれいに組み合わせたもので、非常に高品質です(ええ、余分な指なんて見てないですよね… w)。慎重なプロンプトを用いることで、本当に驚くべき画像を作り出すことができます!いくつかの例はこの投稿の最後にあるギャラリーで見ることができます。

おまけ:シャワーテスト
#

なぜシャワーテストか?サービスのためだけでなく、これらのLoRAによる詳細の増加が少し解剖学に影響を与え、特にお腹やへその描写に影響を及ぼし、まあ、あまり好ましくない結果を生む可能性があるため、このテストを実施しました。そのため、全LoRAを適用した「シャワーテスト」の画像も作成しました。

一般的に問題はありませんでしたが、0.25のノイズ除去強度でも手を全体に塗りつぶしてしまうので、手のインペイントを無効にする必要がありました(AIくん、何を考えているの!?)。

画像は直接表示しませんが、以下のリンクでアクセスできます。

画像にはヌードが含まれ、NSFW(職場閲覧不適切)です。

最後に
#

これらのLoRAに関する概観が皆さんにとって役立ち、イラストへの追加方法(あるいは単にプロンプトの実験…楽しむことが全てです!)に新たなアイデアをもたらすことができれば幸いです。 質問や提案があれば、XやBlueskyでコメントをお寄せください。それではまた!

Einarでした。

ギャラリー
#

モデルレビュー - この記事は連載の一部です
パート 4: この記事