Novinky Obrázky Umelá inteligencia

FLUX.1 – Konkurencia Midjourney, ktorá je zadarmo a bez cenzúry

Flux1 - generátor obrázkov pomocou AI

Je tu nová konkurencia pre Midjourney a ďalšie generátory obrázkov na báze umelej inteligencie. Nový AI model FLUX.1 od nemeckej spoločnosti Black Forest Labs rieši boľavé miesto obrázkových generátorov – zobrazenie rúk a iných častí ľudského tela.

Nemecký startup Black Forest Labs založený inžiniermi, ktorí nedávno odišli zo spoločnosti Stability AI, vo štvrtok oznámila uvedenie svojho prvého AI modelu s názvom FLUX.1. Ide o model na generovanie obrázkov z textu, ktorý veľmi úspešne konkuruje modelom ako Midjourney, DALL-E3 alebo Stable Diffusion.

Flux je zároveň možné do určitej miery používať zdarma a tiež je necenzúrovaný. Teda aspoň. Tento model zároveň prichádza v čase, kedy Midjourney prišla s aktualizáciou na verziu 6.1.

FLUX.1 rieši chronický problém iných generátorov obrázkov

Práve posledný menovaný model nedávno zožal veľkú kritiku za slabé výkony pri vykresľovaní ľudskej anatómie, najmä rúk. S týmito prvkami však majú problémy aj iné AI nástroje na tvorbu obrázkov (hoci v novších verziách sa to zlepšuje). Nie je vôbec výnimočné, že na generovaných obrázkoch majú ľudia tri ruky alebo štyri či šesť prstov.

Práve na tieto problémy okrem iného reaguje FLUX.1, ktorý si používatelia na sociálnych sieťach vychvaľujú. Príkladom je táto ukážka zo sociálne siete X s komentárom: „Flux je skvelý, lepší ako väčšina. Dokonalé ruky.“

Na tejto ukážke zas vidíme, ako tento nástroj zvláda nielen ruky, ale aj celkovú ľudskú anatómiu a dokonca písaný text:

K dispozícii pre vývojárov, aj zdarma

FLUX.1 je dostupný v niekoľkých verziách: v kompletnej komerčnej verzii pre profesionálov, vo verzii s otvoreným prístupom pre vývojárov na nekomerčné účely a v tzv. rýchlej („schnell“) verzii.

Vývojársky model si možno stiahnuť (je však náročný na hardvér) alebo sa dá s nástrojom experimentovať na cloudových platformách, kde sú však k dispozícii len obmedzené možnosti bezplatných kreditov.

K Flux sa dá dostať napríklad  aj cez stránku Hugging Face na tomto linku, alebo cez portál Gliff, kde sú viac pokročilé možnosti pre generovanie obrázkov.

Model využíva tzv. hybridnú infraštruktúru, ktorá pozostáva z kombinácie techník transformácie a difúzie. Podľa svojho pôvodcu predstihuje modely Midjourny či DALL-E aj v kvalite obrázkov a dodržiavaní textových zadaní (promptov).

Spoločnosť v budúcnosti plánuje uviesť aj model na tvorbu videí.

Zdroj: Ars Technica