- Spoločnosť Microsoft predstavila nástroj VASA-1, umožňujúci generovanie realistických virtuálnych tvárí s vizuálnymi afektívnymi vlastnosťami.
- Model VASA-1 dokáže synchronizovať pohyby pier so zvukom a generuje autentické videá rozlíšení 512×512. No zatiaľ nie je k dispozícii verejné demo a budúcnosť použitia pre bežných smrteľníkov je neistá.
Spoločnosť Microsoft odhalila nový nástroj umelej inteligencie pod názvom VASA–1. Tento framework generuje hovoriace tváre virtuálnych charakterov a pridáva im vizuálne afektívne vlastnosti (v anglickej skratke VAS). Spomínaný model VASA-1 je momentálne podľa tvorcov schopný vytvárať pohyby pier. Tie budú pomerne kvalitne synchronizované so zvukom. Dokáže zachytiť a vytvoriť množstvo pohybov tváre a hlavy, čo prispieva k autenticite výsledného videa. Používateľ si bude môcť vygenerovať výsledné videá v rozlíšení 512×512 so 40 snímkami za sekundu.
A ako to celé vyzerá? To si môžete pozrieť v článku, ktorý má Microsoft na webovej stránke. V spomínanom článku je veľa videí, ktoré vytvoril nástroj VASA-1 a StyleGAN (virtuálne avatary). Miestami budete mať problém rozoznať videá od reality, keď uvidíte, ako dobre to všetko funguje..
Pozrite si video, ako VASA-1 od spoločnosti Microsoft funguje
Nakoľko sú si tvorcovia vedomí obrovského potenciálu modelu VASA-1 a aj toho, že by sa veľmi ľahko dal zneužiť, tak online demo zatiaľ von nedali. Navyše, nie je isté, či si my, ako bežní smrteľníci budeme môcť niekedy model vyskúšať. Vzhľadom na vyššie uvedené obavy je jasné, prečo tomu tak momentálne je.