Stable Diffusion XL Turbo - generowanie obrazów w czasie rzeczywistym jest już możliwe. Stability AI wyprzedza rynek
Technologia generowania obrazów z opisów tekstowych właśnie otrzymała solidny zastrzyk wydajności. Za wszystkim stoi Stability AI, które jest odpowiedzialne za stworzenie modeli Stable Diffusion. Na rynku co prawda istnieje wiele konkurencyjnych rozwiązań, natomiast żadne z nich nie jest w stanie generować obrazów tak szybko, jak wprowadzona właśnie edycja XL Turbo. Teraz otrzymujemy obrazy niemalże w czasie rzeczywistym - dosłownie w trakcie pisania.
Nowy model do generowania obrazów o nazwie Stable Diffusion XL Turbo przesuwa granice tej technologii jeszcze dalej. Obrazy są tworzone na naszych oczach i to w trakcie wpisywanego przez nas tekstu.
DALL-E 3 - nadchodzi nowa odsłona generatora obrazów od OpenAI. Zmiany mają wprowadzić niespotykane dotąd możliwości
To, co udało się osiągnąć Stability AI, jest doprawdy imponujące. Omawiany model Stable Diffusion XL Turbo został tak dostosowany, że pod względem szybkości generowania obrazów obecnie nie ma sobie równych. Opiera się on na technice zwanej Adversarial Diffusion Distillation (ADD), która mówiąc w skrócie, pozwala na tworzenie grafik w czasie rzeczywistym. Wszystko przez zmniejszenie potrzebnych "kroków" w całym procesie z 50 do zaledwie 1. Wyjściowe obrazy są co prawda nieco gorszej jakości od bazowego modelu, natomiast kiedy zwiększymy liczbę wspomnianych kroków do 4, uzyskujemy naprawdę świetnie wyniki, które są już porównywalne z "pełnym" modelem.
Midjourney doczekało się wyczekiwanej aktualizacji. Użytkownicy otrzymali większą kontrolę nad wygenerowaną grafiką
Demo możemy sami wypróbować w przeglądarce internetowej pod tym adresem (wymagane jest założenie konta). Oczywiście model jest także dostępny do pobrania dla komputerów, które posiadają układy graficzne NVIDII - pobierzemy go z tego linku. Twórcy chwalą się, że z pomocą układu NVIDIA A100 (specjalnie przystosowany do zadań związanych z SI), można stworzyć obraz o rozdzielczości 512 x 512 px w raptem 207 ms. Model umożliwia także przekształcanie istniejących obrazów, co dobrze uwidacznia materiał wideo z poniższego postu na portalu X. Stability AI udało się stworzyć coś, co z pewnością pchnie ten segment rynku bardzo do przodu.
Quick test with SDXL Turbo, another amazing, super-fast diffusion model. It works right out of the box with @diffuserslib
— Radamés Ajna (@radamar) November 29, 2023
unofficial demo txt2img and img2img: https://t.co/xdYgZpkVN4 pic.twitter.com/abMET8RuvN