2022 egyik legfelkapottabb technológiai trendjét az olyan programok jelentették, melyek pillanatok alatt képesek voltak a beírt szövegből valóban értelmezhető képeket csinálni. Nagyot ment például a DALL-E, mely nyilvános volt és bárki hozzáférhetett.
A szoftvereket, algoritmusokat, a mesterséges intelligenciát folyamatosan fejlesztik a szakemberek. Foglalkoznak ilyenekkel a Facebook anyacégénél, a Metánál, akik egyből a nagyvadra lőnek: szövegből videót készítenek. Make-a-Video nevű újdonságuk egyelőre még nem nyilvános, ám a mögötte zajló tudományos munkáról publikációk is jelentek már meg.
Nehéz ilyenkor megbecsülni, mit tud valójában a Meta algoritmusa, de saját bevallásuk és az általuk közzétett infók szerint elég jól dolgozik találmányuk. Alapvetően három funkcióval rendelkezik: a szöveges megadáson kívül statikus képeket varázsol mozgóvá és meglévő videókat alakít át nagyon hasonlóvá, mégis mássá. A rendszer a tanuláshoz olyan képeket használ, melyek leírásokkal rendelkeznek, emiatt tud a szöveghez egy alapképet társítani, amit aztán meganimál videókkal, melyekből csak azt tanulja meg, hogyan mozog a világ, pluszinformációkra belőlük nem tesz szert.