AnimagineXLの出力を特別なLoRAでグレードアップ！

モデルレビュー - この記事は連載の一部です

パート 1: Animagine XL v3：アニメ風AIイラストに革命をもたらすか？

パート 2: anima_pencil v2レビュー: 簡単に美しいイラストを

パート 3: Animagine XL 3.1: 最高はさらに良くなったのか？

パート 4: この記事

パート 5: 7th Anime XL Aレビュー：美しく詳細なアニメ風イラスト

パート 6: 便利なLoRAで美しい画像を作り出そう！

パート 7: 新モデル「LibrasIllustriousXL」レビュー！話題のIllustriousXLに基づく、柔軟性抜群のアニメ風モデル！

パート 8: 「copycat-RouWei」レビュー！幅広いイラストが描ける、万能で実力派のアニメ風モデル！

パート 9: 「BalvoltSpell」徹底レビュー！多彩な表現力で魅せる最高峰のアニメ風モデル！

パート 10: 映像美と表現力の融合── 「Anime Screenshot Merge 」レビュー！

パート 11: かわいさと柔軟性の両立──「Ikastrious v21」レビュー！

パート 11: 「Iced Coffee IL v40」レビュー！驚異の柔軟性と適応力を誇る万能モデル

こんにちは、Einarです。

AnimagineXLは、バージョン3.0も(バージョン3.1)[https://huggingface.co/cagliostrolab/animagine-xl-3.1]も素晴らしい出力を生み出します。でも、もし品質をさらに向上させる方法があると言ったらどうでしょう？実は、いくつかのLoRAを組み合わせることで、画像の品質を別のレベルに引き上げることができるんです。

全然ありえますよ、まやちゃん！これらのLoRAを詳しく見てみましょう！

LoRAはどのようにテストされたのか？
#

よくやった、詠子さん。それでは、テストのセットアップを早速説明しましょう！

これらのLoRAをSD.Nextを使って個別にテストしました。SD.NextはStable Diffusionのための代替webuiです。画像はCagliostroLab（AnimagineXL 3.1の製作者）が推奨するパラメーターを使用して生成されました：サンプラーには「Euler a」、CFGスケールは7に設定、解像度は832x1216で、28ステップの生成を実行しました。高解像度補助には、20ステップで解像度を2倍にするESRGAN 4xUltrasharpアップスケーラーを使用しました。ノイズ除去強度は0.4に設定されました。

比較用に常に同じ画像を得られるように、シードは1234567890に設定されました。テストされたLoRAに加えて、great lightingのみが使用されました。

テストには、このプロンプトを使用しました：

1girl, original, (solo:1.1),  standing,  waving,  cowboy shot, athletic,
medium breasts, intricate dark brown hair, blue eyes, (bob cut:1.1),
(short hair:1.1), (blunt ends:1.2), left swept bangs,
futuristic black bracelet on right wrist,  smile, yellow t-shirt,
lowleg denim shorts, navel, groin,
detailed ultra photorealistic street of Tokyo, street, car,
crossing, traffic light, crowd, ,  great lighting,  perfect hands,
cinematic angle, detailed shadows, detailed body,  anime artwork,
anime style, key visual, vibrant, studio anime, highly detailed,
newest, late, anime coloring, masterpiece, best quality,
very aesthetic, absurdres,  <lora:great_lighting:4>

そして、FastNegative embeddingを使用したネガティブプロンプトは以下のようになります：

FastNegative, lowres, (bad), text, logo, blurry,  error,
fewer digits, extra digit, missing fingers, worst quality,
jpeg artifacts, low quality, watermark, unfinished, displeasing,
oldest, early, chromatic aberration, signature, extra digits,
artistic error, username, scan, [abstract],
photo, deformed, black and white, realism, disfigured,
low contrast, lipgloss, curly hair, parted bangs  sketch,
(nose:0.9), colored inner hair, (child, loli), (key:1.2),
blush,  key necklace, forehead, bangle, sweatband

この実験では、ADetailerも使用しました。特に、face_yolov8n.pt（ノイズ除去強度0.35）とhand_yolov8n.pt（0.25）の2つのモデルを使用しました。

Bing-su/adetailer

Auto detecting, masking and inpainting with detection model.

Python

4692

376

スタイルをさらに魅力的に: style-enhancer-xl
#

style-enhancer-xl はもともとAnimagine 2.0用に作られたLoRAで、作者によると、AnimagineXLにSD 1.5風のスタイルを取り戻すそうです。これを使ってAnimagine XL 3.1のスタイルをさらに改善しますが、最終結果に過度に影響しない程度にします。実際には、重みは0.6程度です。

これだけでもいいイラストを生成できますが、もっとよくすることができます！

細部まで鮮明に: xl_more_art-full
#

xl_more_art-fullは、より細かいディテールを増やし、生成された画像をより「芸術的」にすることを目的としたLoRAです。写実的な画像には少し向いていますが、SDXL 1.0ベースモデル（追加の変更なし）に基づいているため、Animagine XL 3.1でも問題なく機能します。このLoRAの効果は、特に背景だけでなくキャラクターにも、詳細の劇的な増加をもたらします。効果は非常に強いので、重みは約0.8を使用します。

見ての通り、まやちゃんはとてもかわいいですよね？えへん！もっと真面目に言うと、イラストが非常に詳細なので、高解像度補助のためのノイズ除去強度を下げる必要があります。そうしないと、「無意味な詳細」が大幅に増えてしまいます（例えば、このイラストのまやちゃんの顔にあるノイズを見てください）。私のテストでは、これは0.3から0.4の間に下げることを意味します。

手を貸して: Hands XL
#

手…Stable Diffusionの難敵です。過去1年間、人は手の品質を向上させようと最善を尽くしてきましたが、成功度合いは様々です。どのLoRAもこの問題を完全に解決することはできないと心に留めつつ、Hands XLは少なくとも生成される無意味な手の量を減らす（消去はしない）ことができます。これはperfect handsキーワードでトリガーされます。

このLoRAはADetailerおよびhand_yoloモデルと併用するのが最適で、初期生成を手の位置と形状に使用し、ADetailerで結果をさらに洗練させます。ここではノイズ除去強度に非常に注意する必要があり、値が高すぎると…まあ…「特殊な」手を得てしまう可能性があります。私のテストでは、ADetailerのノイズ除去強度は0.25から0.3の間が最も効果的です。

それでもまだ当たり外れがあります。ここで見ての通り、まやちゃんの手に余分な指を加えるだけでしたw

冗談はさておき、少し努力が必要ですが、少なくとも余分な指だけを心配すればよく、変形した手についてはずっと心配する必要が少なくなります。

イラストに「アニメ」を加える: Anime Face
#

Anime Face、Animagine XL 3.0の出力を向上させるために開発されたLoRAです。これは影、エッジライン、色の彩度を扱う4つの異なるLoRAシリーズの一部です。Animagine XL 3.0と合理的にうまく機能し、3.1にも適用可能です。著者からの推奨重量は1.0です。

見ての通りです（手は気にしないでくださいね！w）、かなりいいアニメ風の「フラットカラー」を得ることができます。しかし、これは欠点となり、生成されたイラストはいくつかの詳細を失います。この問題は、明るい光の中での主題を持つイラストを生成する際に非常に明らかで、すべてが少し平坦すぎます。稀に、顔が体の残り部分と比較して明るすぎることもあります。

したがって、このLoRAは、これらの問題を補うために詳細を増やす他のLoRAと併用すべきです。