
Umelá inteligencia generuje fotografie iba na základe textového popisu
Vedci z Allenovho inštitútu pre umelú inteligenciu vytvorili algoritmus strojového učenia, ktorý dokáže vytvárať obrázky iba pomocou textových titulkov. Hoci jej výtvory vyzerajú trochu hrôzostrašne, ide o dôležitý pokrok v oblasti umelej inteligencie a zobrazovania. Je to skôr experiment na overenie koncepcie s cieľom vytvoriť model počítačového videnia, ktorý dokáže titulkovať fotografie na základe toho, čo „vidí“ na obrázku, a aj naopak, generovať obrázky z titulkov.
Vedci sa najprv pokúsili vytvoriť fotografiu z textového titulku pomocou tzv. modelu LXMERT, ale výsledkom boli nezmysly. Preto sa rozhodli LXMERT upraviť a vznikol tak X-LXMERT. A hoci výsledky, ktoré X-LXMERT generuje po zadaní textového titulku, nie sú úplne „koherentné“, nie sú ani nezmyselné. Väčšina obrázkov obsahuje aspoň hlavné pojmy z textového opisu.
Keď sa však vedci pokúsili získať obrázky na základe špecifickejších pojmov, ako napr. fotograf, fotografické štúdio a pod., výsledky boli úplne vedľa. Hoci výsledky a obmedzenia X-LXMERT pravdepodobne nevyvolajú strach z blížiacej sa AI revolúcie, nakoniec to povedie k lepšiemu rozpoznávaniu obrázkov a zdokonaleniu počítačového videnia. Čím lepší je počítač v porozumení toho, čo máte na mysli, keď opisujete obrázok alebo úlohu na úpravu obrázka, tým zložitejšie úlohy bude schopný v danom obrázku vykonať.
Zdroj: petapixel.com.
Zobrazit Galériu