FLUX.1 – Konkurencia Midjourney, ktorá je zadarmo a bez cenzúry

Je tu nová konkurencia pre Midjourney a ďalšie generátory obrázkov na báze umelej inteligencie. Nový AI model FLUX.1 od nemeckej spoločnosti Black Forest Labs rieši boľavé miesto obrázkových generátorov – zobrazenie rúk a iných častí ľudského tela.
Nemecký startup Black Forest Labs založený inžiniermi, ktorí nedávno odišli zo spoločnosti Stability AI, vo štvrtok oznámila uvedenie svojho prvého AI modelu s názvom FLUX.1. Ide o model na generovanie obrázkov z textu, ktorý veľmi úspešne konkuruje modelom ako Midjourney, DALL-E3 alebo Stable Diffusion.
Flux je zároveň možné do určitej miery používať zdarma a tiež je necenzúrovaný. Teda aspoň. Tento model zároveň prichádza v čase, kedy Midjourney prišla s aktualizáciou na verziu 6.1.
FLUX.1 rieši chronický problém iných generátorov obrázkov
Práve posledný menovaný model nedávno zožal veľkú kritiku za slabé výkony pri vykresľovaní ľudskej anatómie, najmä rúk. S týmito prvkami však majú problémy aj iné AI nástroje na tvorbu obrázkov (hoci v novších verziách sa to zlepšuje). Nie je vôbec výnimočné, že na generovaných obrázkoch majú ľudia tri ruky alebo štyri či šesť prstov.
Práve na tieto problémy okrem iného reaguje FLUX.1, ktorý si používatelia na sociálnych sieťach vychvaľujú. Príkladom je táto ukážka zo sociálne siete X s komentárom: „Flux je skvelý, lepší ako väčšina. Dokonalé ruky.“
flux is great. better than most. perfect hands pic.twitter.com/2HgX4g1Gmi
— Rakesh (@rakwtf) August 6, 2024
Na tejto ukážke zas vidíme, ako tento nástroj zvláda nielen ruky, ale aj celkovú ľudskú anatómiu a dokonca písaný text:
Just see those perfect anotonomy, hands and text. FLUX 1 is just insane.
Images generated by @bfl_ml's FLUX in @tost_ai by @camenduru pic.twitter.com/hcw9mUCRSu
— Gokul Anand (@not_GAllium) August 4, 2024
K dispozícii pre vývojárov, aj zdarma
FLUX.1 je dostupný v niekoľkých verziách: v kompletnej komerčnej verzii pre profesionálov, vo verzii s otvoreným prístupom pre vývojárov na nekomerčné účely a v tzv. rýchlej („schnell“) verzii.
Vývojársky model si možno stiahnuť (je však náročný na hardvér) alebo sa dá s nástrojom experimentovať na cloudových platformách, kde sú však k dispozícii len obmedzené možnosti bezplatných kreditov.
K Flux sa dá dostať napríklad aj cez stránku Hugging Face na tomto linku, alebo cez portál Gliff, kde sú viac pokročilé možnosti pre generovanie obrázkov.
Model využíva tzv. hybridnú infraštruktúru, ktorá pozostáva z kombinácie techník transformácie a difúzie. Podľa svojho pôvodcu predstihuje modely Midjourny či DALL-E aj v kvalite obrázkov a dodržiavaní textových zadaní (promptov).
Spoločnosť v budúcnosti plánuje uviesť aj model na tvorbu videí.
Zdroj: Ars Technica
Najčítanejšie články
Sam Altman: OpenAI vie, ako vytvoriť umelú všeobecnú inteligenciu
10. januára 2025
Nvidia predstavuje osobný AI superpočítač za 3000 dolárov
10. januára 2025
ChatGPT v roku 2025: Čo nové nám Sam Altman sľubuje?
6. januára 2025
Od jednotlivcov po značky: Pika 2.0 formuje budúcnosť video obsahu
23. decembra 2024