Tématem dnešní epizody jsou generátory obrázků na základě textového příkazu. Jak tyto systémy využívají umělou inteligenci, k čemu vůbec jsou a jaká je jejich budoucnost? Opovídá technologický redaktor Seznam Zpráv Pavel Kasík.
Tento týden u nás na Seznam Zprávách vyšel tvůj článek o generátorech obrázků, které využívají neuronové sítě a umělé inteligence. Co tě na tomto tématu tak fascinuje?
Mně to přijde trošku jako setkání úplně s novým druhem komunikace, s novou formou života. Když to nadnesu, tak je to jako setkat se s mimozemšťanem, který nás dlouho studuje, něco o nás ví překvapivě dobře, něčemu zase vůbec nerozumí a je neuvěřitelně mocný. Dokáže toho spoustu, a zároveň některým věcem roztomile nerozumí. Nechápe například, že když pes do něčeho kousne, tak kouše pusou. Nebo například nechápe, jak vypadá zasněžená Praha a zkouší to nějakým způsobem odhadovat. Je hodně blízko tomu, jaké chyby dělá člověk, a přitom je to od nich na míle daleko.
Přijde mi, že se o tom fenoménu málo mluví. Tohle téma na pomezí technologie a umění taky předznamenává určitou změnu v tom, jak můžeme v budoucnosti vnímat člověka a techniku.
Jaký je rozdíl mezi slovy „model“, „robot“, „umělá inteligence“ nebo „neuronová síť“. Co vlastně budeme v tomto rozhovoru používat jako označení generátoru, který vyrobí z příkazu obrázek?
Neuronová síť je určitý typ počítačového programu, který přistupuje k analýze dat specifickým způsobem. Není to jeden program, ale je to několik maličkých prográmků. Každý z nich má nějakou velmi jednoduše jednoduše popsanou funkci a tím, že dáme dohromady ty neurony dáme dohromady, tak ta funkce najednou začne být mnohem složitější a komplexnější. Můžeme udělat třeba neuronovou síť, která dokáže rozpoznat, co uživatel napsal, nebo co vyslovil, poznají co je na obrázku, naučí se jestli je na obrázku obličej nebo kolik je tomu vyobrazenému člověku let.
Neuronová síť se často zaměňuje se spojením umělá inteligence. Umělá inteligence je trošku nadnesený název. Někteří experti ho nemají rádi, protože je zavádějící. Když člověku řekneme inteligence, tak si vybaví nějakou konkrétní schopnost. Vybaví si to, co lidé mají jako inteligenci. A to, co má počítač, nebo to, co my označujeme jako umělá inteligence, tak to není nutně to samé a tím pak dochází ke spoustě omylů nebo nedorozumění. Protože my máme pocit, že když počítač umí něco, co my jsme uměli ve třetí třídě, tak máme pocit, že umí všechno, co jsme se do té doby naučili. A není nám úplně jasné, proč si počítač neumí si zavázat tkaničky, ale zase umí řešit diferenciální rovnice.
Model je vlastně výsledek natrénování neuronové sítě na nějakých datech. Po natrénování je relativně rychle schopná dávat nějaké výsledky. Řekněme, že bych chtěl například udělat neuronovou síť, která dokáže poznat želvy. Želv je ale spousta různých druhů. Taky je můžu mít vyfocené zblízka, z dálky, zespoda, zeshora, ze strany… Je to strašně moc různých věcí a faktorů. Napsat na tohle nějaký klasický program by prostě nefungovalo.
Jediným elegantním řešením je vytvořit si neuronovou síť. Vezme se hromada obrázků, čím víc, tím líp a čím různorodějších, tím líp. Některé obrázky budou mít želvu a bude u nich napsáno „tady je želva“. Další obrázky nebudou mít želvu a u nich bude napsáno „tady není želva“. Na těchto datech se pak model vytrénuje a pokusí se najít, co je „želvovitost“ obrázku. Následně modelu dáme hromadu jiných obrázků, které nikdy neviděl a otestujeme, jestli ten model dává nějaké reálné výsledky.
Neumím si představit, že takhle komplexní systém můžeme udržet v nějakých mantinelech. Jak zařídit, aby najednou nezačal všude kreslit hákové kříže?
V podstatě jednoduchá odpověď je, že se tomu nevyhneme. Například organizace Open AI, která přišla s prvním významným modelem Dall-e 2 se snažila opravdu pečlivě. Fotografie pro svůj model filtrovala předtím, než se je neuronová síť vůbec začala učit. Cílem bylo, aby se tam nedostaly fotografie nebo popisky s násilím, dětskou pornografií nebo další závadný obsah. Ale existují samozřejmě i další modely, které jsou zcela bez pravidel, zcela otevřené. Čímž chci říct, že tomu se vlastně nedá vyhnout. Protože základní principy vytváření těchto modelů jsou známé. Větší nebo zodpovědnější firmy do vývoje můžou na začátku dát víc peněz a času. Mají tak výsledky víc pod kontrolou. Ale v zásadě si takový model, respektive vlastní neuronovou síť může udělat úplně kdokoliv u sebe na počítači.
🤖🖼🤖🖼🤖
Odchod z ČT? Umím si to představit, říká Robert Záruba
Poslali mě do Ruska a zapomněli na mě, říká Petra Procházková
Rozumím Okamurovi i Zemanovi, že k nám nechodili, říká Veselovský z DVTV
Rozhovory se Zemanem si přáli Číňané, říká Jaromír Soukup
„Moderátorkám osahávali před vysíláním nohy.“ S Apolenou Rychlíkovou nejen o ženách v médiích
Bez zvýšení poplatků propustíme čtvrtinu lidí, varuje šéf rozhlasu
Jakub Železný se vrací. Zatím ale neví k čemu
Mediální cirkus - trailer
EU k AI: nesmí nás diskriminovat ani sledovat + JK se loučí
Zapomeňte na bahno a vidle, zemědělcům chybí ajťáci
Nad vodou nás drželi metalisti a pankáči, pořád jim rádi děláme LP
Nepříjemný paradox. Bez diskuse s ropnými giganty klima nezachráníme
Pokrok nezastavíš. Převrat v OpenAI vyhrál kapitalismus
Neodolatelná přitažlivost excentrických samožerů. Příběhy WeWork a FTX se blíží konci
Proč nestačí "čistit" vzduch? Jak funguje zachytávání CO2
Místo obchoďáku Roblox. Proč je OK, že se děti socializují online
Izraelsko-palestinský konflikt se vede i online. Jak to vypadá?
Koncerty a merch jsou pravěk. K-pop jako diplomatická superpower
Předvolební Slovensko jsou dva státy. Ten online, a to co vidíme v realitě
Nové iPhony, soud o budoucnost vyhledávání, Guernica & spektakulární vlaková srážka
Create your
podcast in
minutes
It is Free
Vlevo dole
České podsvětí
Dvě minuty
Angličan
Checkpoint