メインコンテンツへスキップ
「BalvoltSpell」徹底レビュー!多彩な表現力で魅せる最高峰のアニメ風モデル!
  1. ブログ/

「BalvoltSpell」徹底レビュー!多彩な表現力で魅せる最高峰のアニメ風モデル!

· loading · loading ·
目次
モデルレビュー - この記事は連載の一部です
パート 9: この記事

「スレイヤード スレイヤード バルモル 暗き闇の雷よ雷撃《バルヴォルト》!」

こんにちは、Einarです。

現在、Civitaiのようなサイトには大量のモデルがあり、その中から理想のモデルを見つけるのはなかなか大変です。PixAIやTensor.artなどのプライベートモデルを入れるとさらに数は膨大になります。実際、私が今使っているモデルはすべて偶然発見したものばかりです。数週間前、NOMA_XL666さんが私の公開したLoRAを使って、「星光の英雄たち」のキャラたちの素敵なイラストを何枚か投稿しているのを見かけました(これについては後日改めて記事を書きますね!)。そのイラストのメタデータを見たところ、聞いたことのないモデルが使われているのに気付きました。それが今回の主役、BalvoltSpellでした。知っていたのは「BASTARD!!」が由来の名前だということくらいです。

当然、すぐに試さずにはいられませんでした…そして数週間のテストと実験を重ねて、ようやくレビューの準備が整いました!

モデルについて
#

「私の素敵な姿の話じゃないの?」

その「モデル」じゃないよ、まやちゃん。このモデルはDarkSchneiderさんが作成したもので、同作者が手がけた他のIllustrious系およびNoobAI-XL系モデルを統合し、さらにRaehoshi Illust XL v3.0を追加して作られています。プロンプトの使い方や挙動は他のIllustrious/NoobAI-XLモデルとほぼ同じで、デフォルトのスタイルは設定されていません。そのため、キャラクターやシリーズのスタイルを指定するか、豊富に蓄積されたアーティストのスタイルを組み合わせて使用することで、その真価を発揮します。

計画はしっかりと(またかよ!?)
#

「作戦は奇を以って良しとすべし!」

今回はちょっと違うやり方で進めます……というのも、このモデルの特徴を考えた結果です。このモデルにはデフォルトのスタイルがないため、私が作成したキャラLoRAを使って、モデルがキャラクターの外見や魅力、そして美しさをどれだけ正確に表現できるか試してみました。

NoobAIとIllustrious系モデルの適切なパラメータを決めるのは意外に難しく、訓練方法の特徴から、パラメータを間違えると彩度が過剰になったり、最悪の場合、色が完全に破綻したイラストが生成されることもあります。そこで今回は、最適な設定を教えてもらうためにDistyさんに相談しました。提案されたパラメータは以下の通りです。

  • CFGスケール:3.5
  • サンプラー:Euler
  • スケジューラー:Karras
  • 予測方式:Epsilon
  • Betaスケジューラー:linear(これが重要!Illustrious系では良好な結果を得るために必須です)
  • タイムステップ間隔:trailing
  • ステップ数:30(高解像度ステップ数:20)

アップスケーラーには2x-AnimeSharpV3を使用し、ノイズ除去強度0.35、アップスケール倍率は2倍に設定しました。さらに、顔の精度向上のためにSD.Nextに組み込まれているDetailer(ADetailerと同じ機能)を使いました。

そして、このモデル名が漫画「BASTARD!!」にインスパイアされていることにちなみ、今回のイラストは特に記載がない限りファンタジー風に統一しました。「星光の英雄たち」の女性たちの魅力を、新しい視点で楽しんでいただけます!

特に記載がない限り、すべてのプロンプトの最後には以下のクオリティタグを追加しています:

cinematic angle, cinematic lighting, dot nose, anime coloring, newest, year 2024, masterpiece, best quality, amazing quality, absurdres, very aesthetic

ネガティブプロンプトはこちらです:

very displeasing, displeasing, lowres, worst quality, bad quality, low quality, comic, sketch, jpeg artifacts, fewer digits, extra digits, old, oldest, early, lipgloss, parted bangs, blush, child, loli, ai-generated, empty eyes

また、キャラLoRAの強度は0.8〜0.9の範囲で設定しています。

最強のかわいいコンビ誕生!まやちゃんとゆかちゃん
#

それではレビューを始めましょう!まずは当然、宇宙一かわいい存在(えっへん!)である我らが愛しのまやちゃんから。今回はファンタジー設定なので、凛々しい騎士姿をプロンプトで生成してみます。

(ネガティブプロンプトにdual wieldingを追加しました。)

1girl, original, hirukawamaya, holding sword, planted sword, two-handed, full body, long sword, knight, paladin, athletic, medium breasts, brown hair, blue eyes, serious, determined, v-shaped eyebrows, royal, paladin, bikini armor, plate armor, breastplate, tassets, pelvic curtain, navel, groin, linea alba, cape, pauldrons, hill, grass, wind, leaves, outdoors, day, sun, blue sky, cloud, summer, day, <lora:Maya-Hirukawa:0.9>

実に美しいですね!(咳払い)お気付きの通り、今回のレビューはいきなり「ハードモード」から始めました。剣を持っているだけでなく、両手持ちという難しい設定に挑戦!剣の描写はほぼ完璧ですが、良い両手持ちポーズを得るには数回の試行錯誤が必要でした。それでも、テキストプロンプトだけでここまで高品質なイラストを生成できるのは驚異的です。また、仕上がりは理想的な「フラットカラー」で、非常に満足しています。この結果を得るためには先ほど指定したパラメータ設定が重要です。モデルの作者がこれを明示していないため、設定を誤ると彩度が低すぎたり、高すぎたりと、期待外れの結果になる可能性があります。

さて、お次はキュートナンバー2、ゆかちゃんです!彼女はすでに魔法使い風の姿を生成しているので(冒頭の画像を参照)、今回は「神秘的な戦う巫女」風の設定で行きましょう。

(ネガティブプロンプトにdual wielding, multiple weaponsを追加しました。)

1girl, original, inoyuka, fighting stance, standing, clenched hands, (weapon on back), wooden staff, mage staff, battle, brawl, athletic, medium breasts, pink hair, twintails, very long hair, purple eyes, smile, v-shaped eyebrows, face paint, blue tunic, tight clothes, loincloth, circlet, leggings, knee boots, leather boots, tavern, surrounded, surrounded by brigands, unconscious brigand lying on the floor, turned over table, spill, messy room, indoors, stone floor, fantasy, medieval, <lora:Yuka_Ino:0.9>

ゆかちゃん、無敵です!(そろそろ自重した方がいいかも……)今回もまた、かなり難易度が高い構図に挑戦しました。複数の人物、武器(しかも背中に!)、戦闘シーン、動的ポーズなどなど、難易度MAXの設定です。一発で完璧な結果とはいきませんでしたが(特に背中の杖の位置調整に何度か試行錯誤が必要でした)、比較的簡単に生成できたのは素晴らしいことです。この手の設定は従来のモデルにとって苦手なものでしたから。今回は自然言語(英語)を混ぜてプロンプトを作成しましたが(タグだけでは表現しきれないため)、それでもここまで表現力が高いのはモデルの性能の証明ですね!

お姉さんたちの華麗なる競演:アニャさんと詠子さん
#

普通にアニャさんと詠子さんは生成難易度が中程度でした。現在はLoRAを使用しているため、その問題は克服していますが、複雑な衣装やシーンをこのモデルはどこまで再現できるでしょうか?それを確かめるために、まずは詠子さんを(セクシーな!)森のアーチャーにしてみます。

(ネガティブプロンプトにlace-trimmed legwear, japanese armor, dual wieldingを追加しました。)

1girl, original, aramakieiko, standing, archery, holding bow \(weapon\), holding arrow, bow \(weapon\), arrow \(projectile\), athletic, medium breasts, brown hair, two side up, red eyes, smile, v-shaped eyebrows, bikini armor, black panties, brown bra, belt, belt buckle, belt pouch, dagger, thighhighs, compound bow, collarbone, cleavage, gorget, gloves, hair ornament, navel, groin, linea alba, mismatched gloves, (muneate:1.05), armor, quiver, revealing clothes, brown gloves, shoulder armor, single shoulder pad, forest, tree, grass, path, dappled sunlight, day, outdoors, chiaroscuro, fantasy, medieval <lora:Eiko_Aramaki:0.9>

ふぅ!少し難易度を高くしすぎたかもしれません。弓やポーズを正しく生成するのにかなり試行錯誤が必要でした。ただ、これはこのモデルの問題というよりはStable Diffusionの根本的な制限によるものです。むしろ逆で、多少苦労すれば、こんな複雑な衣装や武器を持つ美麗なキャラクターも十分に生成可能です。数か月前まではLoRAを使ってもほぼ不可能だったことを考えると、これは驚くべき進歩です!

さて、アニャさんの場合は美麗なクレリックとして登場していただきます。このモデルの実力はいかほどでしょう?

(ネガティブプロンプトにdual wieldingを追加しました。)

1girl, original, nazonoanya, standing, holding mace, mace, holding weapon, athletic, medium breasts, very long hair, grey hair, green eyes, smile, ponytail, hair ornament, white robe, gold trim, embroidered dress, cleavage, skirt, side slit, midriff, navel, groin, gold cuffs, kneehighs, greaves, church, pillar, stained glass, cathedral, indoors, day, fantasy, medieval, <lora:Anya:0.9>

素晴らしい!!アニャさん、結婚してください!…ごほん。非常に良い結果が得られました。武器もあまり苦労せず、ちゃんとそれっぽく生成されていますね(まさかクレリックは祈りだけが仕事だと思ってましたか?実は強いんですよ!)。また、従来Illustrious/Noob系モデルの弱点だった背景も、それほど破綻せずにうまく描かれています(神様も美しい薄着の女性がお好きなのが分かりますね!)。

ここまでは順調ですが、最大の試練はまだこれからです!次へ進みましょう!

難易度MAX:変身したまやちゃんと武志さん
#

以前はまやちゃんの変身後のパワードスーツが生成難易度の高い問題でしたが、今では専用のLoRAが登場し、少なくともA型スーツに関してはもう悩むことがありません。ただ、今回はさらにこのモデルの性能を試すべく、かなり複雑なシーンを作ってみました。セクシーな(コホン)ヴァルキリーとして村の上空を飛ぶまやちゃんを生成してみます。果たして結果は?

(まやちゃん変身版のLoRAがパワードスーツ生成に特化しているため、ネガティブプロンプトにpauldrons, psuitagata, science fiction, reverse grip, contemporaryを追加しました。)

1girl, original, mayaalt, flying, midair, full body, holding weapon, short sword, holding sword, shining sword, metal buckler, athletic, medium breasts, very long hair, light blue hair, blunt bangs, blue eyes, serious, determined, v-shaped eyebrows, valkyrie, bodycon, breastplate, silver breastplate, shoulder guard, armored skirt, armored leggings, faulds, tassets, navel, groin, thighs, fingerless gloves, gauntlets, waist cape, winged boots, sigil, glowing sigil, fantasy, medieval, plain, cloud, sky, blue sky, village view, village, day, sunlight, cinematic angle, cinematic lighting, dot nose, anime coloring, newest, year 2024, masterpiece, best quality, amazing quality, absurdres, very aesthetic <lora:Maya_Hirukawa_transformed:0.9>

素晴らしい!なんて美しさだ!(もうやめときますね…)。冗談はさておき、この生成の一番の難しさは、適切なプロンプトを考えるところにありました。モデル自体は忠実にプロンプトに従ってくれるため、いい感じの飛行ポーズを得るまでに若干の試行錯誤は必要でしたが、それ以外は比較的容易でした。やはり、このモデルは本当に優秀ですね。

さて、武志さんはLoRAを使ってもなかなか手ごわい相手です(一部のモデルは彼を上手く再現できないことがあります)。今回は誇り高きパラディンとして、頼れる相棒を剣の姿で生成してみます。

(武志さんのLoRAが背教者の鎧に特化しているため、再びネガティブプロンプトにpauldrons, science fiction, reverse grip, contemporary, power armor, beard, stubble, dual wieldingを追加しました。)

1boy, original, yamasetakeshi, arm up, full body, holding weapon, holding sword, long sword, shining sword, male focus, mature male, brown hair, brown eyes, short hair, (ahoge:0.9), serious, determined, v-shaped eyebrows, armor, white gauntlets, white cuisses, white leggings, embroidered armor, faulds, paladin, hill, wind, leaves, gradient sky, sunrise, dawn, fantasy, medieval <lora:Takeshi_Yamase:0.9>

かっこいい!予想を超えた素晴らしい出来で、このポーズもわずかな試行で生成できました。プロンプトをさらに洗練させれば、一発で成功したかもしれません。つまり、武志さんに対しても問題なく、このモデルは指示された内容を正確に実行します。驚くほど幅広い知識を持っていて、豊富な知識を誇ったcopycat-RouWeiをも上回っている印象です!

少しばかりのダイナミズムを!
#

「星光の英雄たち」はアクション要素が強い物語なので、動きのあるシーンがきちんと生成できるかどうかは私にとって重要です。これまでのレビューでは毎回、まやちゃんの変身シーンを生成してきましたが、今回はファンタジーがテーマですので、趣向を変えてみました。ここでは、天使であることがバレてしまい、悪党たちから逃れつつ変身するというシチュエーションのまやちゃんを生成してみます。

1girl, original, hirukawamaya, running, full body, growling, aggressive, incoming attack, clawing, looking at viewer, angel wings, (electricity:1.2), athletic, medium breasts, brown hair, bob cut, blue eyes, serious, determined, clenched teeth, fangs, brown robe, (torn clothes:1.2), (torn dress:1.3), (exploding clothes:1.4), wind, cloth pieces, glowing emblem on neck and glowing runes on thighs. bare shoulders, navel, groin, medieval, village, alley, surrounded, surrounded by menacing human soldiers wearing heavy armor. henshin, (chiaroscuro), outdoors <lora:Maya-Hirukawa:0.9>

素晴らしいプロポー…じゃなくて、素晴らしいシーンです!ここではプロンプトにピリオド(.)を使っていますが、これは自然言語部分とタグ部分を区切る役割を果たしています。すでに述べた通り、このように自然言語(残念ながら英語限定ですが)を活用すると、より細かなシーン設定が可能になります。またこのシーンに関しては、生成したイラストがほぼすべて良い仕上がりだったため、あとは純粋に私の好みで選びました。とても満足できる結果です!

すべては「コントロール」次第!
#

「てめぇら雑魚を制圧しに来たんだよ!」

今回のレビューから新たなテストを導入しました。Illustrious/NoobAI系統のモデルは派生が非常に多く、その性能や学習済み情報にかなりばらつきがあるため、このモデルがControlNetとの相性がどれほど良いか確かめてみました(ControlNetって何?という方は私のチュートリアルをご覧ください!)。ここでは、私がCivitaiで公開している剣を振るポーズを使って、まやちゃんが正義の一撃を放つシーンを生成してみました。今回のテストではNoobAI-XL用のOpenposeLineart Animeモデルを使用し、両方とも強度は1.0に設定しています。再現したい方向けに、以下に使用したコントロール用の画像を掲載します。

ControlNet徹底解説!姿勢も構図も自由自在!
loading · loading

1girl, original, hirukawamaya, full body, standing, incoming attack, holding sword, two-handed, holding weapon, barbarian, athletic, medium breasts, brown hair, bob cut, blue eyes, serious, determined, bikini armor, leather armor, loincloth, bone necklace, face paint, leather gauntlets, leather boots, navel ,groin, linea alba, hill, battlefield, outdoors <lora:Maya-Hirukawa:0.9>

素敵です!可愛いだけではなく、ポーズが完璧に再現されており、誇り高き戦士が敵を叩き潰そうとする瞬間を見事に捉えています!裏では他にもいくつかテストをしてみましたが、ControlNetとの相性はかなり良好だと感じました。ここまでの精度なら、もっと複雑なポーズの生成にも活用できそうですね!

シャワーテスト
#

今回のレビューは徹底したファンタジー設定なので、いつもの「シャワーテスト」も違った趣向でいきます。

画像は直接表示しませんが、以下のリンクでアクセスできます。

画像にはヌードが含まれ、NSFW(職場閲覧不適切)です。

その価値はあったのか?
#

「降参… 何もできなかった… これがこのモデルの真の力なの…?」

さて、結論を言いましょう。このモデルは実に素晴らしく、以前レビューしたcopycat-RouWeiをも凌ぐ性能を持っています。プロンプトへの応答性は抜群で、幅広い知識を持ち、自然言語(英語)とタグの両方をしっかり理解するため、どんなタイプの画像生成にも柔軟に対応できます。ただし、デフォルトのスタイルがないため、そこを重視する方にはcopycat-RouWeiの方が向いているかもしれません。

とはいえ、アニメ風の画像生成に興味がある方には、間違いなく強く推奨できるモデルです。試してみて損はないですよ!

執筆中に現れた新たな刺客!
#

「えへへ、お肌ツルツルになっちゃった!」

本レビューを執筆中に、作者のDarkSchneiderさんから新たなモデルVoivodSpellがリリースされました。こちらは多数のモデルを融合した、なんとも…興味深い構成になっています。直感的には動作しないようにも思える複雑な合成ですが、実際にはBalvoltSpellよりさらにパワーアップした印象を受けました。両方を試してみて、自分に合った方を見つけてみてはいかがでしょうか。参考として、VoivodSpellで生成した画像をいくつかご覧ください。

最後に
#

今回のレビューは以上です。いつも通り、最後までお読みいただきありがとうございます!この記事の最後にあるギャラリーにも、モデルで生成した他の画像を掲載していますので、ぜひご覧ください。

今後の投稿も楽しみにお待ちください!ご意見や感想はぜひXでお知らせくださいね。それでは、また次回!

Einarでした。

ギャラリー
#

モデルレビュー - この記事は連載の一部です
パート 9: この記事