メインコンテンツへスキップ
Animagine XL 3.1: 最高はさらに良くなったのか?
  1. ブログ/

Animagine XL 3.1: 最高はさらに良くなったのか?

· loading · loading ·
目次
モデルレビュー - This article is part of a series.
Part 3: This Article

こんにちは、Einarです。

過去数週間、素晴らしいAnimagine XL 3.0を作成したCagliostroLabチームがモデルのアップデートに取り組んでいるという兆候がありました。数週間後、そのモデルは実際にリリースされました! 3.0が大好きだった私は、すぐにそれをダウンロードして遊び始めました。

このモデルは前バージョンと同じくらい良いのでしょうか?また革命的なのか、それともただのマイナーアップデートなのか?それをこのレビューで見ていきましょう!

お知らせ
#

ちょっとしたおさらいとして(詳しくは前回のレビューをチェックしてね)、AnimagineXL 3.1はSDXL 1.0をベースにしたStable Diffusion XL(SDXL)モデルです。主にDanbooruスタイルのタグを学習していますが、ある程度は自然言語(英語のみ)も使用できます。

Animagine XL v3:アニメ風AIイラストに革命をもたらすか?
· loading · loading

SD 1.5モデルと比較して、プロンプトの構造はいつもとは少し異なります(しかし、例えばPony Diffusionモデルのように厳格ではありません):

1girl,<キャラクター名>, <該当するシリーズ名(あれば)>, <プロンプトの残り>

実は、Animagine XL 3.1にはたくさんのキャラクターやシリーズが組み込まれていて、LoRAを使わずに多彩なキャラクターやスタイルを生成できます。

前バージョンと同じく、オンラインデモで実際に試してみることができますよ(ただし、A1111や他のwebuiで得られる出力とはかなり異なるかもしれません)。

どのようにテストするか?
#

「マスター!プロトコルに従ってください!」

その通り、詠子さん!このテストでは、モデルの出力が全く変わらないように、LoRAを一切使用しないことにしました。品質タグから始めましょう。素敵な「フラットカラー」のルックを確実に得るためにanime coloringを追加し、モデルをより良い外観に向かわせるためにbest aestethicを加えました:

anime artwork, anime style, key visual, vibrant, studio anime,
highly detailed, newest, late, anime coloring, masterpiece, best quality,
best aestethic

アニメ風のイラスト用に推奨されるプロンプトとFastNegativeをネガティブプロンプトとして使用しました:

FastNegative, lowres, (bad), text, error, fewer digits, extra digits,
missing fingers, worst quality, jpeg artifacts, low quality, watermark,
unfinished, displeasing, oldest, early, chromatic aberration, signature,
extra digits, artistic error, username, scan, [abstract], photo,
deformed, black and white, realism, disfigured, low contrast

「その通り、これで私、すごくきれいになるわ!」

私のキャラクターには、いつも使用しているこれらのタグもネガティブプロンプトに追加しました:

lipgloss, curly hair, (parted bangs:1.2), sketch, (nose:0.9),
colored inner hair, (child, loli), (key), forehead, blush

keyは必要です。さもなければ、AIくんがkey visualを誤解して実際の鍵を画像に生成してしまうことがあります。まさか!

シンプルから始めよう
#

それでは、通常のテスト手順に入りましょうか。まずは宇宙で一番かわいい女の子(えへん!)、私たちの大好きなまやちゃんから始めます。テストの一環として、彼女をいつものセーラー服で都市の設定で生成してみます。プロンプトは長くなりますが、AnimagineXLの場合、短いプロンプトが必ずしも良いわけではありません。

(ネガティブプロンプトにsweatband, bangle, buttonsが追加されました)

1girl, original, (solo:1.1),  standing, hands on hips, cowboy shot, athletic,
toned, medium breasts, intricate dark brown hair, blue eyes, (bob cut:1.1),
(short hair:1.1), (blunt ends:1.2), left swept bangs,
futuristic black bracelet on right wrist, smile, open mouth,
serafuku, white sailor shirt, dark blue pleated skirt,
(dark blue sailor collar:1.05), aqua neckerchief, short sleeves,
detailed ultra photorealistic street in a suburb of Tokyo, suburb,
short houses, wall, waterway, noon, cinematic angle, great lighting,
detailed shadows, detailed body, anime artwork, anime style, key visual,
vibrant, studio anime, highly detailed, newest, late, anime coloring,
masterpiece, best quality, best aestethic,

次の結果は良いものの、Animagine XL 3.0のアニメ風から少し逸脱しています。特に、「マスピの顔」が以前よりも少し増えています。しかし、これは小さな問題であり、backlightingsidelightingのようなタグで軽減することができます。線はきれいで鋭いです。3.0とは異なりますが、それ自体としてはとてもいいです。

満足していますか?もちろん、そんなわけありません!まやちゃんのことなら、いつだって飽きることはありません!テストの一環として、彼女が普段着のカジュアルな服装でどのように見えるか見てみましょう:

(ネガティブプロンプトにsweatband, bangleが追加されました)

1girl, original, (solo:1.1), standing, v over eye, cowboy shot, athletic,
medium breasts, intricate dark brown hair, blue eyes, (bob cut:1.1),
(short hair:1.1), (blunt ends:1.2), left swept bangs,
futuristic black bracelet on right wrist, smile, yellow t-shirt,
lowleg denim shorts, navel, midriff, groin, hip lines,
detailed ultra photorealistic street in a suburb of Tokyo, suburb,
short houses, wall, waterway, noon, cinematic angle, great lighting,
detailed shadows, detailed body, anime artwork, anime style,
key visual, vibrant, studio anime, highly detailed, newest,
late, anime coloring, masterpiece, best quality, best aestethic,

かわいい!えへん!この生成が示すように、スタイルはAnimagine XL 3.1とは異なりますが、かなり一貫性があり、一般的に良い結果をもたらします。右手の指から見てわかるように、どのSDモデルでもまだ問題がありますが、私の経験では3.0よりも少しよくなっています。

では、かわいさで2番目のベストガール、ゆかちゃんの番です!ほとんどのSDとSDXLモデルでの彼女の外観は大きな問題はありませんでした(時々彼女のツインテールの位置が間違っていることがありますが、いいネガティブプロンプトで修正できます)。驚くことではありませんが、Animagine XL 3.1でも、ゆかちゃんは超かわいいままです:

(ネガティブプロンプトにlow twintails, short twintails, ponytail, side ponytail, buttons, long sleevesが追加されました)

1girl, original, (solo:1.1), standing, hands on hips, cowboy shot, athletic,
medium breasts, intricate light pink hair, very long hair, twintails,
high twintails, long twintails, uneven twintails, purple eyes, grin,
white sailor shirt, dark blue pleated skirt, dark blue sailor collar,
aqua neckerchief, (short sleeves:1.1),
detailed ultra photorealistic street in a suburb of Tokyo, suburb,
short houses, wall, waterway, noon, cinematic angle, great lighting,
detailed shadows, detailed body, anime artwork, anime style, key visual,
vibrant, studio anime, highly detailed, newest, late, anime coloring,
masterpiece, best quality, best aestethic,

今回は、ゆかちゃんの明らかな美しさはもちろんのこと、このモデルの強みの一つである照明に気が付いたかもしれません。`great lightingやcinematic lightingを単に追加するだけで、驚くべきイラストを作り出すことができます。基本モデルのレビューをしたいので示しませんでしたが、great lightingのようなLoRAsを追加することで、出力をさらに改善することができます(やまとーるさん、これが私の「秘密」です!)

今回は、ゆかちゃんの明らかな美しさに加え、このモデルの一つの強み、すなわち照明にも注目していただけたことでしょう。great lightingcinematic lightingを追加するだけで、見事なイラストを作成できます。基本モデルのレビューが目的なので、示していませんが、 great lightingのようなLoRAsを加えることで、さらに出力を向上させることが可能です(やまとーるさん、これが私の「秘密」です!)

もっと難しいキャラクターはどうか?
#

過去のレビューで述べてきたように、アニャさんや詠子さんのイラストを生成するのは時に難しいことがあります。その理由は、SD(そしてSDXL)モデルの中には、アニャさんのOL服に苦労するものがあること、そしてすべてのアニメモデルが詠子さんの「ツーサイドアップ」の髪型を理解しているわけではないからです。まずは美しいアニャさんをテストにかけてみましょう。

(ネガティブプロンプトにlow ponytail, side ponytailが追加され、lipglossの強度が1.1に増加されました)

1girl, original, (solo:1.1), standing,  waving, cowboy shot, athletic,
(mature female:1.1), medium breasts, intricate (silver hair:1.1),
very long hair, ponytail, high ponytail, long ponytail, green eyes,
enigmatic smile,, office lady, black suit, formal wear, black jacket,
dark blue tie, black pencil skirt, black thighhighs,
detailed ultra photorealistic office, window, desk, chair,
computer, ceiling, ceiling light, Tokyo, Japan, noon, cinematic angle,
great lighting, detailed shadows, detailed body, anime artwork,
anime style, key visual, vibrant, studio anime, highly detailed,
newest, late, anime coloring, masterpiece, best quality, best aestethic

いつものように美しく魅力的で、Animagine XL 3.0を使用したときと少し外見が異なりますが、私の心に描いている彼女のイメージから逸脱することはありませんから、大丈夫です。選んだこの画像に至る前に作成した15世代のうち、たった一つだけが彼女の服装を間違えました。その結果は、プロンプトが非常に忠実に守られました。

では、クレイジーな天才エンジニアの詠子さんはどうでしょうか?詠子さんの研究室の服装をも使って、チャレンジをさらに難しくしました。SD 1.5モデルの多くは、彼女の髪型だけでなく、白衣の概念(よくジャケットとして表現される)にも苦労します。さあ、見せてくれよ、Animagine XL 3.1!

(ネガティブプロンプトにtwintails, ponytail, side ponytail, long hair, (jacket, trenchcoat)が追加されました)

1girl, original, (solo:1.1),  standing, hand to own chin, cowboy shot,
athletic,  athletic, mature female, medium breasts,
intricate dark brown hair, short hair, (two side up), ahoge,
red eyes, confident and proud smile, white collared shirt,
(black) pencil miniskirt, black thighhighs, white (labcoat),
employee card, lanyard, open labcoat, detailed ultra photorealistic
futuristic laboratory in a secret underground base, futuristic equipment,
electronic devices, electronic parts, secret base, indoors, underground,
cinematic angle, great lighting, detailed shadows, detailed body,
anime artwork, anime style, key visual, vibrant, studio anime,
highly detailed, newest, late, anime coloring, masterpiece,
best quality, best aestethic,

何度か試してみて見た目を正確に再現するのに少し時間がかかりました(Animagine XL 3.0を使った時も同じでしたが)、でも見てください、私たちの天才エンジニアがその栄光の中で輝いています! また、Animagine XL 3.1の照明の良さがどれだけ素晴らしいかが観察できます。もっと明るいものが欲しい場合は、great lightingを外して、ネガティブプロンプトにdarkness, nightを追加することができます。

難題に挑む:まやのパワードスーツと武志
#

まやのパワードスーツを作るのはいつも難しいです。特に、一貫した外見を作り出すのが問題です。典型的な生成では、スーツの見た目が互いに大きく異なります(色も含む)。あるモデルは他のモデルよりも良い結果を出しますが、そのために私のテストでは変身したまやちゃんの姿を使います。それに、彼女はいつもかっこいいですよね?ねえ?

(ネガティブプロンプトにshort hair, dark blue hair, fantasy, knightが追加されました)

1girl, original, (solo:1.1),  standing,  crossed arms, cowboy shot,
athletic, mature female, medium breasts, intricate baby blue hair,
very long hair, (blue eyes), (blunt bangs:1.3), serious, determined,
v-shaped eyebrows,  (white:1.1) bodycon futuristic cyberarmor, breastplate,
vambraces, faulds, cuisses,
detailed ultra photorealistic rooftop of skyscraper in Tokyo, city view,
high place , sunset, golden hour lighting, dusk, outdoors, cinematic angle,
great lighting, detailed shadows, detailed body, anime artwork,
anime style, key visual, vibrant, studio anime, highly detailed,
newest, late, anime coloring, masterpiece, best quality, best aestethic,

かっこいいすぎる!えへん、話を戻しましょう:私が作成したほとんどの画像は一貫性があります。SDモデルと同様に、スーツのグローブが生成されないことがありますが、それはしばしば後処理で対処できる問題です。

さて、武志さんの話をしましょう。彼が「星光の英雄たち」の主人公であっても、正しく生成するのは非常に難しいです。主に、モデルが女性キャラクターに偏っているためです。あるモデルでは不可能で、他のモデルでは難しく、稀に簡単なケースもあります。いい知らせですが、Animagine XL 3.1では武志さんを比較的簡単に正しく生成することができました。

(ネガティブプロンプトに1girl, female, shotaが追加されました)

 1man, original, (solo:1.1), standing, cowboy shot, hands in pockets,
 mature male, (toned male:0.8), male focus, dark brown hair,
 dark brown eyes, (very short hair:1.1), pixie cut,  (ahoge:0.9),
 hair between eyes, light smile, frameless glasses, rimless eyewear,
 hands in pockets, white (polo shirt), breast pocket, short sleeves,
 dark brown trousers,
 detailed udetailed ultra photorealistic living room in a house in Tokyo,
 couch, bookshelf, carpet, TV, window, indoors, noon, midday,
 cinematic angle, great lighting, detailed shadows, detailed body,
 anime artwork, anime style, key visual, vibrant, studio anime,
 highly detailed, newest, late, anime coloring, masterpiece,
 best quality, best aestethic,

悪くないですよね?でも、武志さんにとっての本当の挑戦はもっと先にあります。彼の背教者の鎧は、以前は作るのが非常に難しかったんです。

(ネガティブプロンプトに1girl, female, shota, (fantasy, knight), cape, capelet, (white cyberarmor, violet cyberarmor), heavy armorが追加されました)

1man, original, (solo:1.1), standing, cowboy shot, crossed arms,
(toned male:0.8), male focus, dark brown hair, dark brown eyes,
(very short hair:1.1), pixie cut,  (ahoge:0.9), hair between eyes,
serious, determined, v-shaped eyebrows, (blue:1.2) cyberarmor,
breastplate, vambraces, cuisses, day, detailed ultra photorealistic
suburb of Tokyo, (rain:1.2), short houses, road sign, narrow streets,
(rain:1.1),  grey sky  cinematic angle, great lighting, detailed shadows,
detailed body, anime artwork, anime style, key visual, vibrant,
studio anime, highly detailed, newest, late, anime coloring,
masterpiece, best quality, best aestethic,

これを正しく生成するのには何回か試みが必要でした(3.0の時の方が間違いなく簡単でした)。主に、鎧の色が正確に出なかったためです(しばしば白い部分が現れました)。私の推測では、もっと一貫した出力を得るためには、スタイルを少し変更するためにLoRAを使用するべきだろうと思います(恐らくstyle enhancer-xl)、もしくは武志さん用のLoRAを自分で作るべきかもしれません。

最大の難易度:ダイナミックシーン
#

Animagine XL 3.0は、動的または複雑なシーンを生成する際に本当に際立っていました。Stable Diffusionの制約を考慮しても、プロンプトに忠実に従い(少しの運もあり!)驚くべきイラストを創出するからです。

3.1も同様で、改善された照明が大いに役立ちます。こちらはまやちゃんが変身する様子の例です。

(ネガティブプロンプトにsweatband, bangle, buttonsが追加されました)

1girl, original, (solo:1.1), standing, raised fist,
surrounded by electricity, enveloped by electricity, dynamic scene,
cowboy shot,medium breasts, intricate dark brown hair, blue eyes,
(bob cut:1.1), (short hair:1.1), (blunt ends:1.2), left swept bangs,
futuristic black bracelet on right wrist, serious, determined,
powerful, brave, dominant, v-shaped eyebrows, serafuku,
white sailor shirt, dark blue pleated skirt, dark blue sailor collar,
aqua neckerchief, short sleeves, (torn clothes:1.2),
(torn shirt:1.1) showing the bra underneath, (torn skirt:1.05),
electricity, electricity on the bracelet, glowing lines over body,
lightning, (wind, whirlwind:1.2), henshin,
detailed ultra photorealistic plaza in Tokyo,
cinematic composition, epic composition, cinematic lighting, outdoors,
cinematic angle, great lighting, detailed shadows,
detailed body, anime artwork, anime style, key visual,
vibrant, studio anime, highly detailed, newest, late,
anime coloring, masterpiece, best quality, best aestethic

かっこいいですよね?少し努力すれば、数ヶ月前には不可能と思われていたような本当に複雑なシーンも作成できます!

シャワーテスト
#

モデルを試すときに行うテストの一つに、NSFWコンテンツにも役立つかどうかを見ることがあります。この実験を「シャワーテスト」と呼んでいます:私のキャラクターの一人がシャワーを浴びているシーンを生成し、モデルが彼女のヌードを描くことができるかどうかを確認します。この場合、問題なく機能します。

画像は直接表示しませんが、以下のリンクでアクセスできます。

画像にはヌードが含まれ、NSFW(職場閲覧不適切)です。

では、このモデルはどうなのか?
#

「とても良いわ!合格よ!」

Animagine XL 3.1は3.0からの非常に堅実な改善だと思います。特に、追加のトレーニングのおかげで得た照明と追加の概念は、あなたのアニメ風の生成に適した優れたモデルになっています。

驚くべきことに、新しい概念の学習は新規ユーザーにとって問題の源になることがあります。モデルは「美学」の概念を得たので、特定のプロンプト(私はbest aestethicを使用しますが、very aestethicを使用する人も見かけます)なしでは、生成は良質に向かって誘導されません。

時間をかけて実験し、何ができるか見てみることをお勧めします。私に関しては、3.1がとても気に入ったので、(いくつかの強化を施した上で)3.1を独占的に使用し始めました(これについては将来のブログ投稿のトピックになります)。

最後に
#

レビューの最後に来ました。この投稿の最後には、このモデルで作成されたさまざまな主題やキャラクターで何ができるかを見ることができるイラストがあります(これらの一部は過去にXやBlueskyに投稿されています)。

Animagine XL 3.1の能力を気に入りましたか?あなたもまやちゃんが宇宙で一番かわいい女の子だと思いますか(えへん!)?XやBlueskyで思いを教えてください!それではまた!

Einarでした。

ギャラリー
#

モデルレビュー - This article is part of a series.
Part 3: This Article