Nechá si Apple ujsť ďalšiu príležitosť v oblasti AI?

ChatGPT, Midjourney a ďalšie: Musí sa Apple zapojiť do pretekov v generatívnej umelej inteligencii?

ChatGPT je všetko, o čom sa v poslednej dobe v technologickom svete hovorí, a to z dobrého dôvodu. Nástroj poháňaný umelou inteligenciou je pôsobivý, ale je tu aj veľa obáv – porušovanie autorských práv, plagiátorstvo, používanie na školách, dokonca aj strata pracovných miest, takže sa nemožno čudovať, že ľudia, ktorí sa živia písaním, sú v strese z AI, ktorá zdanlivo dokáže dobre písať. Existujú však aj technologické spoločnosti, ktoré vidia budúcnosť v schopnosti počítačov prirodzene konverzovať a vytvárať obsah, ktorý môžu firmy skutočne používať a to v takom rozsahu, rýchlosti a za takú cenu, ktorej ľudia nemôžu konkurovať.

ChatGPT, Google Bard a Bing chat od Microsoftu sú však len malou súčasťou generatívnej revolúcie AI. Umelecký svet už rok hýri novými nástrojmi generatívnej umeleckej inteligencie a straší rovnakými problémami – predsudkami, autorskými právami, stratou pracovných miest atď. Deepfakes, kde neurónové siete vymieňajú ľudí vo videách s ohromujúcou presnosťou, boli špičkou ľadovca.

Tieto nástroje nie sú len bleskom z jasného neba. Sú v plienkach a veľmi rýchlo sa zlepšujú. Veľké technologické spoločnosti ako Google a Microsoft považujú túto novú generatívnu umelú inteligenciu za masívnu súčasť budúcnosti nás všetkých. Upevnenie nároku a vybudovanie vedúcej pozície je pre ne rovnako dôležité, ako bolo ovládnutie webu v 90. rokoch.

V hre však nie je jeden hráč: Apple. Zdá sa, že najhodnotnejšia technologická spoločnosť na svete úplne vynecháva revolúciu v oblasti počítačov. Apple nie je v oblasti AI žiadnym nováčikom – so Siri vyvolala revolúciu v oblasti virtuálnych asistentov, ale svoj náskok už premrhala aj tým, že neinvestovala dostatočne veľa prostriedkov, aby sa ubránila konkurencii.

AI, ktorá analyzuje vs. AI, ktorá tvorí

Z predstavenia integrácie ChatGPT do vyhľadávača Microsoft Bing.

Všetky najväčšie technologické spoločnosti sa už roky chvália umelou inteligenciou. AI, ktorá izoluje a analyzuje vašu reč pre diktovanie a hlasových asistentov a dokáže rozlišovať medzi hlasmi pre personalizované výsledky. AI, ktorá spája nahrané zvuky, aby s vami „hovorila“. AI, ktorá izoluje časti obrázkov, aby ich bolo možné jednoducho upravovať. AI, ktorá identifikuje predmety a osoby a umožňuje vám lepšie vyhľadávať. AI, ktorá vám umožní vybrať text na akomkoľvek obrázku.

Všetky tieto veci Apple vie a robí. Do všetkých svojich čipov dokonca zabudovala Neural Engine, špecializovaný hardvér, ktorý urýchľuje úlohy strojového učenia. Apple dokonca pracuje na najväčšej výzve v oblasti AI, ktorou sú samojazdiace autá.

Generatívna AI je však niečo iné. Je to novšia trieda umelej inteligencie, ktorá vytvára niečo úplne nové takmer bez použitia textového vstupu. Áno, trénovanie modelov zaberie kopec času a potrebuje extrémne veľa dát, ale potom sú tie modely, ktoré používatelia spustia, relatívne malé a môžu zdanlivo vytvoriť nekonečné množstvo nových vecí. AI, ktorá dokáže nájsť všetky mačky vo vašej fotoknižnici, je niečo úplne iné ako tá, ktorá dokáže od základu nakresliť mačku v najrôznejších umeleckých štýloch.

Stable Diffusion, Midjourney, DALL-E

A nejde len o písané slovo. Minulý rok sme sa všetci dobre pobavili pri tvorbe nezmyselných obrázkov DALL-E 2, ale po ďalšom tréningu a vylepšeniach sa tieto generatívne nástroje umelej inteligencie hodia na oveľa viac ako len na vytváranie obrázkov potápajúcich sa mačiek v štýle anime s akváriom nad hlavou.

Nástroje Midjourney a Stable Diffusion sú tak dobré, že vytvárajú obrázky, ktoré by pokojne mohli zdobiť obálku časopisu – a dokážu ich vytvoriť desiatky za pár minút.

Tieto nástroje dokážu oveľa viac ako len vytvárať úplne nové obrázky v širokej škále štýlov. Dokážu zmeniť vstupné obrázky. App Store je už zaplavený aplikáciami na tvorbu avatarov a profilových obrázkov, ktoré využívajú tento softvér na to, aby zobrali niekoľko fotografií vašej tváre a upravili ich zmenou fyzických čŕt. Ako napríklad nasadenie slnečných okuliarov, ktoré vyzerajú úplne reálne.

Minulý rok to bol len nápad, ale technológia sa vyvíja tak rýchlo, že dnes je to už nástroj. Spoločnosť Adobe už vylepšila množstvo svojich aplikácií o nástroje na generovanie obrázkov s pomocou AI, na obnovu fotografií jedným kliknutím a výrazne vylepšené odstraňovanie objektov. Adobe však plánuje čoskoro pridať do svojich produktov významnú generatívnu AI, ktorá umožní doslova vložiť do existujúcich fotografií obrázky, ktoré budú vyzerať, akoby do nich zapadali.

Dall-E 2 je viac než len nástroj na vytváranie bláznivých obrázkov.

Úzky priestor na manévrovanie

A kde je v tom všetkom Apple? Spoločnosť sa stavia do pozície technologického lídra, najmä v kreatívnej oblasti. Ale s výnimkou niekoľkých blogových príspevkov zo stránky o strojovom učení a niekoľkých relatívne nenáročných optimalizácií knižníc pre Apple Silicon sa zdá, že Apple túto príležitosť vynecháva. Teda, myslím si, že DiffusionBee Divama Guptu je super cool, ale je to malá nezávislá aplikácia tretej strany, ktorá už dlho nebola aktualizovaná a v oblasti generovania obrázkov s AI už postupne zaostáva.

Táto technológia bude mať úplne transformačný charakter. Neveríte mi? Pozrite si výskum OpenAI v oblasti generovania hudby. Vytvára novú hudbu v rôznych štýloch vrátane spevu, a to úplne z ničoho. VALL-E od Microsoftu dokáže generovať šokujúco realistické hlasy, pričom ako vstupný údaj použije len malý útržok hlasu osoby. Dokáže dokonca napodobniť rôzne emocionálne stavy.

Mnohé z týchto projektov a desiatky ďalších sú stále vo fáze výskumu. Nie je ťažké nájsť nejaké nedostatky v ktoromkoľvek z nich. Ale cesta z výskumu do reálneho sveta bude rýchla a nedostatky sa budú hľadať veľmi ťažko.

Apple má nástroje na vytvorenie vlastného generatívneho chatbota s umelou inteligenciou vďaka komponentu Neural Engine zabudovanému do čipov iPhonu a Macu, ktorý dokáže vykonať až 15,8 bilióna operácií za sekundu, spolu s Core ML a API pre strojové učenie. Z vnútra Cupertina sme však zatiaľ nezaznamenali žiadny posun. Presnosť a rýchlosť sú pri chatbotoch s umelou inteligenciou mimoriadne dôležité – akcie a dôveryhodnosť spoločnosti Google sa minulý týždeň prepadli po chybe v jej chatbote Bard – takže je možné, že sa potichu v zákulisí pracuje na Siri. S množstvom zdrojov, ktoré má Apple k dispozícii, však zostáva otázka: Venuje tomu vôbec pozornosť?

Ak Apple úplne nesleduje oblasť umelej inteligencie, nemusí si uvedomiť, ako rýchlo sa vyvíja. Trvalo rok, kým sa generatívna AI zmenila z „hlúpeho online výskumného projektu“ na „súboj spoločností Microsoft a Google“. O ďalšie dva roky budú tieto nástroje desaťkrát lepšie a bude ich oveľa viac. Budete mať problém rozlíšiť, čo je skutočné a čo úplne vygenerované AI zo vzduchu. Ak máte obmedzené umelecké schopnosti, generatívna AI vám výrazne uľahčí realizáciu vašich nápadov.

Neural Engine v čipoch M1 a M2 od Apple dokáže vykonať bilióny operácií každú sekundu.

Apple bola so Siri na čele pri zavádzaní hlasového asistenta s umelou inteligenciou. Ako sa táto technológia vyvíjala, Apple zaostávala a teraz sa Siri často považuje za sklamanie, ktoré sa nemôže porovnávať so službami Google Assistant alebo Alexa. Pokiaľ ide o generatívnu AI, Apple nemá ani výhodu prvého hráča, ako to bolo v prípade Siri. Veľké aj malé technologické spoločnosti už dodávajú výkonné nástroje. Ak nebude konať, Apple jednoducho zostane pri výrobe hardvéru, na ktorom bude fungovať naša budúcnosť založená na generatívnej AI. Možno to Apple nevadí, ale keďže predaj hardvéru stagnujú a softvérová a servisná stránka podnikania spoločnosti Apple rastie, naozaj si nemôže dovoliť nebyť lídrom v revolúcii generatívnej AI.

Samozrejme, Apple je jednou z najtajomnejších technologických spoločností, najmä pokiaľ ide o softvér. Apple má možno veľké tímy, ktoré usilovne pracujú na zavedení funkcií generatívnej AI do aplikácií iMovie, Final Cut Pro, Logic Pro, Fotky, Mail, Správy a celého balíka iWork. Všetky tieto produkty by sa mohli úplne zmeniť vďaka výkonným nástrojom generatívnej umelej inteligencie. Vieme, že Apple približne pred rokom kúpila minimálne jednu spoločnosť zaoberajúcu sa generatívnou umelou inteligenciou, AI Music. Nebol by som prekvapený, keby sme v produktoch Apple tento rok videli aspoň nástroj pre generovanie originálnych soundtrackov do videa.

O generatívnej AI by sme od Apple nemuseli počuť vôbec nič a potom na konferencii WWDC boom! Generatívna AI svetovej triedy vo všetkých produktoch Apple! Dúfam, že to tak bude, pretože ak sa Apple príliš oneskorí s takouto transformačnou technológiou, odsúdi svoj softvér na dlhé roky za konkurenciou.

zdroj: macworld