高画質を求めて ~Highres Fixによる高画質化~

公開日:

更新日:

512x768のサイズだけでしか作れないのだろうか?
AIイラストを触り始めの頃は512x768で生成された画像をESRGAN 4Xというアップスケーラー(超解像度化)をして画質を上げていたのですが、ある日、使用しているツールにある機能が追加されました。それがHighres Fixです。この記事ではその機能を使うと何ができるのかをいろいろと語っていきます。 

ESRGAN 4Xで超解像度化しても十分綺麗ではある

上の画像はHighres FixではなくESRGAN 4Xを使っています。この写真はWaifu Diffusionというモデルを使い、うちの子である白髪ちゃんに着物を着せて生成した画像です。サイズは768x512で4倍に超解像度化しています。もちろんこの方法でも十分にきれいなのですが、Highres Fixを使うことでより綺麗に生成することができます。

プロンプト:

(masterpiece:1.2), (best quality:1.2), (1girl:1.2), (looking at viewer:1.2), upper body, messy hair, white hair, short hair, (aesthetic anime eyes:1.2), ahoge, blush cheeks, highres, (cute:1.2), (petite:1.2), (small_breasts:1.2), beautiful skin, (happy:1.2), open mouth, (arms behind back:1.2), embarrassed face, kneeling, backlighting, bokeh of fireworks, kimono


そもそもHighres Fixとは?

AIイラストはStable Diffusionというプログラムを使用して生成しますが、それを操るためのツールであるWeb UIというものがたくさんあります。Novel AIやHolara AIもStable Diffusionを使っています。私がいつも使用しているのはAUTOMATIC1111氏が作成しているWeb UIを使っており、様々な機能が備わっていて、拡張機能もたくさんありカスタマイズ性は抜群です。
その中の機能にHighres Fixがあるのです。
私も詳しく中身は知らないのですが、同プロンプト、同シードで大きいサイズでi2i(image to image)をして、解像度を上げているようです。

じゃあ、どれくらい綺麗になるの?
実際に比較してみましょう。

プロンプト:

1girl, cute, petite, short hair blonde hair, beautiful detailed golden eyes, hair between eyes, :3, fox ears, small breasts,, looking at viewer, yellow parka, standing, beautiful detailed shiny skin, upper body, from behind, centered, background of metropolis, bright sky, sun shafts, clouds, ray tracing, ((light reflection)),

これは512x768で生成してHighresもESRGANも適用していないです。では、この画像をもとにESRGANを適用してみましょう。


AUTOMATIC1111 Web UIでは標準でESRGAN 4Xが使えます。ExtraタブでUpscaler 1のリストの中にありますので、これを使います。拡大倍率は2倍にします。
どうでしょう?ディテールがより繊細になってノイズなども少なくなりましたね。
それではHighres Fixの方を見てみましょう。



設定はLatent (nearest-exact)ですが無印でも十分に使えます。もし書き込みを増やしたくないのであればNoneを選択することで解像度向上だけでi2iに渡すこともできます。
Denoising Strengthはi2iと同じ設定です。0.6~0.7が効きやすい気がしますね
Upscale byのスライダーで目的の解像度に設定できます。Hires stepsは0に設定することでSampling stepsと同じステップで生成します。

Highres Fixを使うと向いてる方向が変わってしまいましたね。でもディテールはかなり描きこまれています。


まとめ
Highres Fixを使うことで目のハイライトや背景の描き込みなどといったものがより繊細に作られるため、この機能があることで私は高画質なイラストを生成することができるのです。ですがこの機能はi2iの機能を使っているため、より時間がかかってしまうのと、解像度を大きくしすぎるとグラフィックボードのVRAMが少ないというエラーが起きてしまい作ることができないのです。なのでフルHD(1920x1080以上)はHighres FixではなくESRGANを使うことをお勧めします。

長々と書きましたが私が高画質なAIイラストを生成することができるのはこの機能のおかげです。これからどんどん技術が発展していき、一枚の画像を生成する時間も短くなっていくのではないかと思いますね。AIイラスト界隈の進展が早すぎて追いつけてないので早く追いつかねば(汗)

ちなみに画像の狐はルクスちゃんって言います。かわいがってくださいw


chichi-pui様主催のAI COLLECTIONまもなく開催!

AI COLLECTION」はAIによって生成された画像(加筆可)だけをとりあつかった展示即売会で、数々の最強AI術師が生成したイラストを実物で拝見できるかなり貴重なイベントです!残念ながら私は参加できないのですが、ぜひ行ってみてください!

「AI COLLECTION」の詳細

開催日時:2023年4月8日(土) 11:00~18:00
開催場所:川崎市産業振興会館 4F 展示場
住所:〒212-0013 神奈川県川崎市幸区堀川町66番地20
入場料:無料