こんにちは、Einarです。
これまでにも良いモデルをいくつか レビューしてきました、が――理想の「アニメ風」モデルを探す旅は終わりません!
今使っていたモデルもかなり良かったんですが、もう一歩、自分の思い描く完璧なスタイルに近づきたくて…。
というわけで、今回も(毎回素晴らしい!)モデルをいろいろ試していたんですが、どうしても「あと少し何かが足りない」感じが拭えず――
そんなとき、なんとなくCivitAIを眺めていたら、ふと目に入ったモデルがこちら。
“Anime Screenshot Merge”
見た瞬間に「これだ!」と直感して、すぐにダウンロードしました。
…果たしてその直感は正しかったのか? それとも早とちりだったのか?
今回のレビューで確かめていきましょう!
始めに #
うん、ゆかちゃん。今回はちょっと違うんだよ。
難しい話は抜きにして説明すると、モデルの生成にはいくつか手法があります。
IllustriousやNoobAI系のモデルで使われている一般的な方法が、いわゆる epsilon
(eps)方式。
一方、NoobAI-XLの登場に合わせて、より品質とプロンプトの反映率を高めるために別の方式―― v-prediction
(略して v-pred
)が採用されたモデルも登場しました。
そしてここが大事なんですが、v-predとepsではプロンプトやサンプラーの設定が互換性ゼロです。
間違って混ぜて使うと…ええ、えらいことになります。
下手すると人類に反旗を翻すレベルのナニカが生まれますので、良い子は真似しないでね!
そんなv-predモデルですが、BalvoltSpellやCopycat-rouWeiと同様、デフォルトのスタイルが存在しません。
なので、LoRA(LoRAって何?という方はこちらのチュートリアルをどうぞ!)を使うか、プロンプトでスタイルを指定する必要があります。
今回は自作キャラLoRAと、MeMax Flat Anime Style Aを併用しました。
(ただし後者は必須ではありません)
ちなみに、v-predモデルはパラメータの影響を非常に受けやすいため、設定をミスると見事に崩壊します。
そこで今回は、Distyさんにお願いして、最適な設定を教えてもらいました。
提案していただいたパラメータは以下の通りです。
- CFG スケール:3.5
- サンプラー:Euler
- スケジューラー:lambdas
- 予測方式:v-prediction
- Beta スケジューラー:scaled
- タイムステップ間隔:trailing
- ステップ数:30(高解像度ステップ数:20)
アップスケーラーには2x-AnimeSharpV3を使用し、ノイズ除去強度 0.35、アップスケール倍率は 2 倍に設定しました。さらに、顔の精度向上のためにSD.Nextに組み込まれているDetailer(ADetailerと同じ機能)を使いました。内蔵のVAEは使用せず、代わりにsdxl-vae-anime-alpha-67500
を使用しています。
特に記載がない限り、すべてのプロンプトの最後には以下のクオリティタグを追加しています:
(anime coloring, anime screenshot, anime screencap:1.0), newest, year 2024, masterpiece, best quality, amazing quality, absurdres, very aesthetic <lora:MeMax5-noob-vpred:1> <lora:NOOB_vp1_detailer_by_volnovik_v1:1>
プロンプトへのスタイルタグの影響を減らすために、これらのタグはメインプロンプトから改行で分けています(SD.Nextでは、これはA1111でいうところの BREAK
と同等の効果があります)。この点は留意してください。
ネガティブプロンプトはこちらです:
very displeasing, displeasing, lowres, worst quality, bad quality, low quality, comic, sketch, jpeg artifacts, fewer digits, extra digits, old, oldest, early, (lipgloss), parted bangs, child, loli, ai-generated, dutch angle, blush, text, twitter username, realistic, traditional media, 3d, dimple, dimple facial mark,
ここまで準備が整ったところで、いよいよレビュー本編に入っていきましょう!
最高にかわいいコンビ、まやちゃんとゆかちゃん #
レビューはまずこの子から始めなきゃいけません。そう、かわいさ担当、まやちゃん!(咳払い)
最初のテストでは、彼女に教室で制服姿で立ってもらいます。
1girl, solo, hirukawamaya, looking at viewer, , standing, waving, athletic girl, medium breasts, brown hair, bob cut, blue eyes, bracelet, smile, serafuku, school uniform, summer uniform, dark blue sailor collar, dark blue pleated skirt, aqua neckerchief, classroom, school desk, school chair, window, midday, day, noon,, cinematic angle, cinematic lighting, dot nose <lora:Maya_Hirukawa:0.9>
かわいい!!! …ゴホン。つまり、なかなか良い出来です。ほぼ理想通りの“フラットな塗り”に近い感じが出ていますね。
IllustriousやNoobAI系のマージモデルによく見られるように、背景にちょっとした弱点が見えます。たとえば後ろの椅子、ちょっと想定と違う形をしてますよね。とはいえ、これはこのモデル特有というわけでもなく、これらのモデル群では「いつものこと」ではあります。
今回のサンプラー構成では、色味が鮮やかでシャープな印象になっており、これはかなり好印象です!
もちろん、これで終わりじゃありません。
次はまやちゃんに別の衣装(衣装です!何を想像しましたか?)を着てもらいましょう。彼女の…その、美しさが引き立つ、普段着です。
1girl, solo, hirukawamaya, looking at viewer, from side, three quarter view, hand on hip, arm at side, contrapposto, athletic girl, medium breasts, brown hair, bob cut, blue eyes, bracelet, standing, smile, yellow shirt, t-shirt, denim shorts, open fly, navel, groin, lowleg, street, city, urban, sidewalk, crosswalk, skyscraper, tokyo \(city\), midday, day, noon, cinematic angle, cinematic lighting, dot nose
きれい! ですが、あまりに美しすぎる光景に目を奪われてばかりもいられません。
まやちゃん本人の生成は非常に良好だった一方で、背景はやはりIllustriousやNoobAI系によく見られる“シンプル構成”の傾向が残っています。
ただしこれはそこまで悪い話ではなく、いわゆる「ディテーラー」LoRA(背景の安定化や強化をしてくれるLoRA)を使えば、かなり改善されることも多いです(それでもある程度の「カオス」はつきまといますが…)。
まあ、まやちゃんがどんなモデルでも可愛いことは証明済みなので――
では、「2番目に可愛い」ゆかちゃんは、このモデルでどうなるでしょうか?
今回はライティングの検証も兼ねて、時間帯が違うシチュエーションで試してみます。
1girl, solo, inoyuka, looking at viewer, , athletic girl, medium breasts, pink hair, very long hair, twintails, hair scrunchie, purple eyes, hands on hips, standing, grin, serafuku, school uniform, summer uniform, dark blue sailor collar, dark blue pleated skirt, aqua neckerchief, street, suburb, city, urban, wall, house, tree, utility pole, road sign, evening, cinematic angle, cinematic lighting, dot nose <lora:Yuka_Ino:0.9>
うん… ゆかちゃんがとんでもなく可愛いのはさておき(咳払い)、全体として悪くない出来だと思います。
特に私のLoRAはもともと全体的に画面を明るめに寄せる傾向があるのですが、今回は「明るさ補正系LoRA」は使っていません。その割に、シャドウの乗り方が自然でシャープな印象です。
背景に関しても、多少の謎要素はあるものの、IllustriousやNoobAI-XL系列の“あるある”範囲内に収まっていて、特別おかしいという印象はありません。
頼れるお姉さんたち、アニャさんと詠子さん #
少し前までは、詠子さんとアニャさんを「中級者向けキャラ」に分類していたのですが――自作LoRAを作ってからは、もはやそうでもありません。
というわけで、今回は“頼れるお姉さんたち”という括りでいきましょう(この流れだとこのみさんは…? 次回に登場してもらいましょうか)。
さて、このモデルでオフィス勤務中のアニャさんを再現すると、どうなるでしょうか。
1girl, solo, nazonoanya, looking at viewer, standing, athletic girl, mature female, medium breasts, grey hair, very long hair, ponytail, green eyes, hand to own chin, smile, office lady, black thighhighs, suit, blue necktie, office, window, desk, chair, monitor, urban, midday, day, noon,, cinematic angle, cinematic lighting, dot nose <lora:Anya:0.9>
大人の魅力、でもどこか可愛さもある――それがアニャさん!
…なのですが、背景にちょっと謎なディテールが混ざっています。特にモニターと机のあたりですね。これはモデルの性質によるところもありますし、Illustrious系モデルの“いつもの弱点”でもあります。
通常のプロンプトではうまくいかない場合は、背景特化のLoRAを併用することをおすすめします。毎回運任せで祈るより、ずっと精神衛生に良いです(笑)
とはいえ、致命的な問題ではないので、気になる方は覚えておくと良いかも。
では次は詠子さん。どんな感じになるでしょうか?
1girl, solo, aramakieiko, looking at viewer, , mature female, athletic girl, medium breasts, brown hair, two side up, ahoge, red eyes, crossed arms, standing, smile, v-shaped eyebrows, lab coat, light blue shirt, collared shirt, pencil skirt, black thighhighs, id card, red lanyard, laboratory, underground, secret base, science fiction, holographic screen, holographic interface, futuristic equipment, teleporter, cinematic angle, cinematic lighting, dot nose <lora:Eiko_Aramaki:0.9>
こちらもきれいに出ました! アニャさんのときと同様に、キャラの仕上がりはとても良い一方で、背景はややシンプルめな印象です。このようなケースでは、プロンプトにちょっとだけ情報量を足すことで背景の精度が上がることも多いです(※やりすぎ注意!)。
ちょっとした工夫で仕上がりに差が出るので、いろいろ試してみるのもアリですよ。
難関キャラたち:変身姿のまやちゃんと武志さん #
LoRAの活用によって生成精度はかなり向上しましたが、それでも変身姿のまやちゃん、そして特に武志さんの生成は一筋縄ではいきません。 まやちゃんは、主に余計なディテールが混入しないようにするのが課題。
武志さんはというと、そもそもLoRAがあっても生成がうまくいかないモデルもあるくらいなので、依然として“難関キャラ”扱いです。
ではまず、麗しき変身後のまやちゃんから(え?もう黙れ?)。
1girl, solo, mayaalt, looking at viewer, , athletic girl, medium breasts, light blue hair, very long hair, blunt bangs, blue eyes, Pointing, pointing at viewer, serious, determined, v-shaped eyebrows, psuitagata, white bodysuit, power armor, white power armor, white gloves, school rooftop, midday, day, noon,, cinematic angle, cinematic lighting, dot nose <lora:Maya_Hirukawa_transformed:0.9>
おおっ、これはかなりいい感じ!
今回のまやちゃんは文句なしの仕上がりです。
他のテストでは武器を持たせたりライフルを構えさせたりしましたが、どれも良好でした。
というわけで、これは文句なしの合格!
続いて、私服の武志さんです。
1boy, solo, yamasetakeshi, standing, looking at viewer, mature male, male focus, brown hair, brown eyes, (ahoge:1), smile, hands in pockets, standing, glasses, brown pants, white shirt, polo shirt, shirt tucked in, short sleeves, breast pocket, street, suburb, city, urban, wall, house, tree, utility pole, road sign, midday, day, noon,, cinematic angle, cinematic lighting, dot nose <lora:Takeshi_Yamase:0.9>
※ ネガティブプロンプトには (beard, stubble, 1girl
) を追加しています
うん、間違いなく武志さんです!
しかも、若すぎず老けすぎず――これまではLoRAを使ってもなかなか安定しなかったんですが、今回は一発目でこの仕上がりでした。
これは素直に嬉しい進歩です。
では続けて、背教者姿の武志さんはいかがでしょうか? この姿は、やや若めに出力されがちな傾向がありますが…
1boy, solo, yamasetakeshi, standing, looking at viewer, (mature male:1.05), male focus, brown hair, brown eyes, (ahoge:1), holding sword, holding weapon, fighting stance, long sword, serious, determined, v-shaped eyebrows, armor, blue armor, power armor, black undersuit, street, suburb, city, urban, wall, house, tree, utility pole, road sign, midday, day, noon,, cinematic angle, cinematic lighting, dot nose <lora:Takeshi_Yamase:0.9>
※ ネガティブプロンプトには (beard, stubble, 1girl
) を追加しています
こちらも、なかなか良い仕上がり!
この一枚を見ると、モデルの進化を実感しますね。
1年前までは、プロンプトだけで武志さんに剣を持たせるなんて、まず無理だったんです…。
残る難関はあと2つ!このモデルがどこまで耐えられるか、引き続き見ていきましょう。
ダイナミックなシーン #
ポーズや動きのあるシーンは、現在のモデルでもまだ少し難しいところがあります。 というのも、そもそも学習データにそういった構図があまり含まれていないためです(Danbooruですら、ほとんどは静的な構図ですし)。
とはいえ、IllustriousやNoobAI-XL系では、かなり作りやすくなったのは事実です!
というわけで、レビュー恒例(?)、まやちゃん変身直前シーンからいってみましょう!
1girl, solo, hirukawamaya, looking at viewer, , clenched hands, raised fist, (powering up, aura), (electricity:1.2), electricity on bracelet, athletic girl, medium breasts, brown hair, bob cut, blue eyes, bracelet, standing, henshin, (torn clothes:1.2), (exploding clothes:1.4), (torn shirt, torn skirt), navel, groin, cloth pieces, serious, determined, v-shaped eyebrows, serafuku, school uniform, summer uniform, dark blue sailor collar, dark blue pleated skirt, aqua neckerchief, street, suburb, city, urban, wall, house, tree, utility pole, road sign, night, dark, late night, blue hour, darkness, dim lighting, (chiaroscuro),, cinematic angle, cinematic lighting, dot nose <lora:Maya_Hirukawa:0.9>
おお、いい感じ! 少し静的に見えるところはありますが、エフェクト強化系のLoRAを一切使っていないにもかかわらず、ここまで表現できるというのはかなり柔軟なモデルだと思います!
そして、まやちゃんのボデ…げふんげふん!
い、いや、その…落ち着いて評価しましょう。
さて、いよいよ最後の試練です! このモデル、ここまでの負荷に耐えられるでしょうか?
最後の試練:ControlNetで検証! #
ControlNet(知らない方はこちらのチュートリアルをご覧ください)は、モデルの性能を測るうえで非常に優れたストレステストになります。
というのも、モデルによっては入力画像の追従度が大きく異なるからです。
・強度が弱すぎると、入力画像が反映されにくくなり
・逆に強すぎると、不自然に引っ張られることも
――そんな難しさがあります。
今回は、剣を構える誇らしげ(かつ美しい)まやちゃんを生成してみます。
ControlNetには、NoobAI-XL向けのDepth(強度0.5に設定しました)とLineart Anime(強度1.0)を使用しました。再現したい方のために、使用したコントロール画像も掲載しておきます。


1girl, solo, hirukawamaya, standing ,full body, holding sword, holding weapon, athletic girl, medium breasts, brown hair, bob cut, blue eyes, bracelet, serious, determined, v-haped eyebrows, bikini armor, leather armor, fantasy, brown cape, tattered cape, castle, moat, building, tree, midday, day, noon,, cinematic angle, cinematic lighting, dot nose<lora:Maya-Hirukawa:0.9> <lora:MeMax5-noob-vpred:1>
これは文句なしの出来!
他モデルでよく見られる彩度の暴走もなく、入力画像の追従度もしっかりしているように見えます。しかも、今回はパラメータ調整ゼロで一発出力だったので、モデルの安定性としても非常に高いと感じました。
この完成度は、本当にすごいです!
シャワーテスト #
モデルを試すときに行うテストの一つに、NSFWコンテンツにも役立つかどうかを見ることがあります。この実験を「シャワーテスト」と呼んでいますg:私のキャラクターの一人がシャワーを浴びているシーンを生成し、モデルが彼女のヌードを描くことができるかどうかを確認します。この場合、問題なく機能します。
最後に #
さてさて、詠子さんの言う通り「点数タイム」です!
正直なところ、このモデルを使い始めた瞬間から「これはすごい」と感じていました。 もちろんIllustriousやNoobAI系モデルにありがちな問題点は一部残っていますが、
アニメ風モデルとして「欲しい要素」がほぼすべて揃っているといっても過言ではありません。
・高い柔軟性
・Illustrious/NoobAIベースのスタイルとキャラ資産の継承
・プロンプト追従性の高さ
…いやもう、完璧では? と思ってしまうほどです。
記事の最後にギャラリーもありますので、他の作例もぜひご覧ください。
というわけで、今回のレビューはここまでです! 楽しんでいただけたでしょうか? そして、少しでもこのモデルに興味を持ってもらえたなら嬉しいです!
今後も紹介したいモデルやTipsがまだまだあるので、ぜひこのブログやXをチェックしてみてくださいね。それでは、また次回!
Einarでした。
ギャラリー #







