Po týždňoch špekulácií a únikov, ktoré nedali spávať fanúšikom umelej inteligencie, Google vo štvrtok oficiálne vyložil karty na stôl. Predstavil model Nano Banana Pro, ktorý sľubuje vyriešiť jeden z najväčších problémov generatívnej AI – prácu s textom a komplexnými vizuálmi.
Kým doterajšie generátory obrázkov často bojovali s „rozsypaným čajom“ namiesto čitateľných nápisov, Nano Banana Pro prichádza s prísľubom bezchybného vykresľovania textu. Táto schopnosť z neho robí ultimátny nástroj na tvorbu infografík, diagramov a prezentačných materiálov.
Od ručných poznámok k profesionálnym diagramom
Google v blogovom príspevku vysvetľuje, že Nano Banana Pro nie je len o „maľovaní“ pekných obrázkov. Model využíva vylepšené logické uvažovanie, hlboké znalosti o svete a prístup k informáciám v reálnom čase. Vďaka tomu dokáže pochopiť hĺbku a nuansy požiadaviek.
„Nano Banana Pro je najlepší model na vytváranie obrázkov so správne vykresleným a čitateľným textom priamo v obraze, či už hľadáte krátky slogan alebo dlhý odsek,“ uvádza Google.
V praxi to znamená revolúciu pre študentov, výskumníkov či manažérov. Model dokáže:
- Premeniť náčrt na diagram: Stačí nahrať fotku ručne písaných poznámok a AI z nich vytvorí čistý, profesionálny diagram.
- Vytvoriť vizuálny návod: Google demonštroval schopnosti na výzve „Vytvorte infografiku, ktorá ukazuje, ako pripraviť elaichi chai“. Výsledkom bol presný vizuálny postup s textovými inštrukciami.
- Lokalizovať obsah: Model zvláda širokú škálu písem, kaligrafie a dokáže generovať text vo viacerých jazykoch pre medzinárodné trhy.
Inteligencia napojená na Google Search
To, čo robí Nano Banana Pro skutočne mocným nástrojom na infografiky, je jeho schopnosť vyhľadávať informácie. Ak mu zadáte tému, model si dokáže prostredníctvom Google Search dohľadať potrebné fakty a tie následne vizuálne spracovať do prehľadnej grafiky. Užitočné je to najmä pri štúdiu zložitých tém alebo zhrnutí výskumných prác do jedného obrázka.
Sociálne siete zaplavili dáta
Používatelia, ktorí získali prístup k testovacej verzii (často označovanej v súvislosti s Gemini 3), okamžite začali skúšať hranice nového modelu. Sociálne siete sa plnia infografikami a diagramami bohatými na text, ktoré dosahujú desaťtisíce zobrazení. Tieto virálne ukážky potvrdzujú, že Google sa v oblasti renderovania textu posunul na úplne novú úroveň, čím otvára dvere pre automatizovanú tvorbu edukatívneho a marketingového obsahu. Nižšie nájdete ukážky, ktorými sa pochválili užívatelia.

