2025 m. DI Indekso ataskaita (AI Index Report)
Stenfordo Žmogaus ir Dirbtinio Intelekto instituto (Stanford HAI) nuomone, DI ruošiasi tapti pačia transformuojančia XXI amžiaus technologija. Tačiau jo nauda nepasiskirstys tolygiai, jei nekreipsime pakankamo dėmesio jo apgalvotai plėtrai. 2025 metų DI indeksas siūlo vieną iš išsamiausių, duomenimis pagrįstų dirbtinio intelekto apžvalgų.
Pripažintas patikimu šaltiniu visame pasaulyje žiniasklaidos, vyriausybių ir pirmaujančių įmonių, DI indeksas aprūpina politikos formuotojus, verslo lyderius ir visuomenę griežtomis, objektyviomis įžvalgomis apie DI techninę pažangą, ekonominę įtaką ir poveikį visuomenei.
Svarbiausios išvados:
DI našumas sudėtingose užduotyse nuolat gerėja. 2023 m. mokslininkai pristatė naujus lyginamuosius testus – MMMU, GPQA ir SWE-bench – skirtus išbandyti pažangių DI sistemų ribas. Vos po metų jų našumas smarkiai išaugo: balai atitinkamai padidėjo 18,8, 48,9 ir 67,3 procentinio punkto MMMU, GPQA ir SWE-bench testuose. Be standartinių užduočių, DI sistemos padarė didelę pažangą generuojant aukštos kokybės vaizdo įrašus, o kai kuriais atvejais kalbos modelių agentai netgi pralenkė žmones programavimo užduotyse, turėdami ribotą laiką.
Dirbtinis intelektas vis labiau integruojamas į kasdienį gyvenimą. Nuo sveikatos priežiūros iki transporto, DI sparčiai juda iš laboratorijų į kasdienį gyvenimą. 2023 m. JAV Maisto ir vaistų administracija (FDA) patvirtino 223 medicinos prietaisus su DI, lyginant su vos šešiais 2015 metais. Keliuose autonominiai automobiliai jau nėra eksperimentai: „Waymo“, vienas didžiausių JAV operatorių, kas savaitę suteikia daugiau nei 150 000 autonominių kelionių, o „Baidu“ prieinama „Apollo Go“ robotaksių flotilė dabar aptarnauja daugelį Kinijos miestų.
Verslas visuotinai pasinėrė į DI, skatindamas rekordines investicijas ir naudojimą, o tyrimai toliau rodo stiprų produktyvumo poveikį. 2024 m. JAV privačios investicijos į DI išaugo iki 109,1 mlrd. dolerių – beveik 12 kartų daugiau nei Kinijos 9,3 mlrd. dolerių ir 24 kartus daugiau nei JK 4,5 mlrd. dolerių. Ypač didelis pagreitis buvo stebimas generatyviniame DI, kuris visame pasaulyje pritraukė 33,9 mlrd. dolerių privačių investicijų – 18,7 % padidėjimas nuo 2023 m. DI naudojimas versle taip pat spartėja: 2024 m. 78 % organizacijų pranešė, kad naudoja DI, palyginti su 55 % metais anksčiau. Be to, vis daugiau tyrimų patvirtina, kad DI didina produktyvumą ir daugeliu atvejų padeda sumažinti įgūdžių spragas visoje darbo jėgoje.
JAV vis dar pirmauja kurdama geriausius DI modelius, tačiau Kinija mažina atsilikimą našumo srityje. 2024 m. JAV įsikūrusios institucijos sukūrė 40 žymių DI modelių, gerokai aplenkdamos Kinijos 15 ir Europos tris. Nors JAV išlaiko kiekybinę lyderystę, Kinijos modeliai sparčiai sumažino kokybės atotrūkį: našumo skirtumai pagrindiniuose testuose, tokiuose kaip MMLU ir HumanEval, sumažėjo nuo dviženklių skaičių 2023 m. iki beveik vienodų 2024 m. Tuo tarpu Kinija toliau pirmauja DI publikacijų ir patentų srityje. Kartu modelių kūrimas vis labiau globalėja, su žymiais pristatymais iš tokių regionų kaip Artimieji Rytai, Lotynų Amerika ir Pietryčių Azija.
Atsakingojo DI ekosistema vystosi – tačiau nevienodai. Su DI susijusių incidentų sparčiai daugėja, tačiau standartizuoti atsakingojo DI (ADI) vertinimai vis dar reti tarp pagrindinių pramoninių modelių kūrėjų. Vis dėlto nauji testai, tokie kaip HELM Safety, AIR-Bench ir FACTS, siūlo perspektyvias priemones vertinti faktų patikimumą ir saugumą. Tarp įmonių išlieka atotrūkis tarp ADI rizikų pripažinimo ir prasmingų veiksmų. Priešingai, vyriausybės rodo didesnį skubumą: 2024 m. sustiprėjo pasaulinis bendradarbiavimas DI valdymo srityje, o tokios organizacijos kaip EBPO, ES, JT ir Afrikos Sąjunga paskelbė pagrindinius atsakingojo DI principus, tokius kaip skaidrumas ir patikimumas.
Pasaulinis optimizmas dėl DI auga, bet išlieka dideli regioniniai skirtumai. Tokiose šalyse kaip Kinija (83 %), Indonezija (80 %) ir Tailandas (77 %) didelė dauguma mano, kad DI produktai ir paslaugos yra labiau naudingi nei žalingi. Priešingai, optimizmas išlieka gerokai mažesnis tokiose vietose kaip Kanada (40 %), JAV (39 %) ir Nyderlandai (36 %). Vis dėlto nuotaikos keičiasi: nuo 2022 m. optimizmas ženkliai išaugo keliose anksčiau skeptiškai nusiteikusiose šalyse, įskaitant Vokietiją (+10 %), Prancūziją (+10 %), Kanadą (+8 %), Didžiąją Britaniją (+8 %) ir Jungtines Valstijas (+4 %).
DI tampa efektyvesnis, prieinamesnis ir įperkamesnis. Padedant vis pajėgesniems mažiems modeliams, sistemos, veikiančios GPT-3.5 lygiu, išvadų kaina sumažėjo daugiau nei 280 kartų nuo 2022 m. lapkričio iki 2024 m. spalio. Aparatinės įrangos lygmeniu išlaidos kasmet mažėjo 30 %, o energijos efektyvumas kasmet gerėjo 40 %. Atvirojo kodo modeliai taip pat mažina atotrūkį nuo uždarųjų modelių, sumažindami našumo skirtumą nuo 8 % iki vos 1,7 % kai kuriuose testuose per vienerius metus. Kartu šios tendencijos sparčiai mažina pažangaus DI naudojimo kliūtis.
Vyriausybės stiprina veiksmus DI srityje – reguliuoja ir investuoja. 2024 m. JAV federalinės agentūros pristatė 59 su DI susijusius reglamentus – daugiau nei dvigubai daugiau nei 2023 m. – ir juos išleido dvigubai daugiau agentūrų. Visame pasaulyje teisės aktų nuorodos į DI išaugo 21,3 % 75 šalyse nuo 2023 m., o tai žymi devynių kartų padidėjimą nuo 2016 m. Kartu su didėjančiu dėmesiu, vyriausybės investuoja dideliu mastu: Kanada įsipareigojo skirti 2,4 mlrd. dolerių, Kinija įsteigė 47,5 mlrd. dolerių puslaidininkių fondą, Prancūzija įsipareigojo skirti 109 mlrd. eurų, Indija – 1,25 mlrd. dolerių, o Saudo Arabijos projektas „Transcendence“ yra 100 mlrd. dolerių vertės iniciatyva.
DI ir kompiuterių mokslo švietimas plečiasi, tačiau išlieka prieigos ir pasirengimo spragos. Du trečdaliai šalių dabar siūlo arba planuoja siūlyti K–12 kompiuterių mokslo švietimą – dvigubai daugiau nei 2019 m., o Afrika ir Lotynų Amerika daro didžiausią pažangą. JAV absolventų, įgijusių kompiuterių mokslo bakalauro laipsnius, skaičius per pastaruosius 10 metų išaugo 22 %. Vis dėlto daugelyje Afrikos šalių prieiga išlieka ribota dėl pagrindinės infrastruktūros, pvz., elektros, trūkumo. JAV 81 % K–12 kompiuterių mokslo mokytojų teigia, kad DI turėtų būti įtrauktas į pagrindinį kompiuterių mokslo švietimą, tačiau mažiau nei pusė jaučiasi pakankamai pasirengę jį dėstyti.
Pramonė sparčiai lenktyniauja DI srityje, tačiau pažangos sritis siaurėja. Beveik 90 % žymių DI modelių 2024 m. buvo sukurti pramonėje, palyginti su 60 % 2023 m., o akademinis sektorius išlieka pagrindiniu didelio cituojamumo tyrimų šaltiniu. Modelio mastas ir toliau sparčiai auga – mokymui reikalinga skaičiavimo galia padvigubėja kas penkis mėnesius, duomenų rinkiniai kas aštuonis, o energijos suvartojimas kasmet. Tačiau našumo skirtumai mažėja: balų skirtumas tarp geriausio ir 10-ojo modelio per metus sumažėjo nuo 11,9 % iki 5,4 %, o du geriausius dabar skiria vos 0,7 %. Pažangos sritis tampa vis konkurencingesnė ir vis labiau užpildyta.
DI pelno aukščiausius įvertinimus už savo poveikį mokslui. Auganti DI svarba atsispindi pagrindiniuose mokslo apdovanojimuose: dvi Nobelio premijos pripažino darbus, kurie lėmė gilųjį mokymąsi (fizika) ir jo pritaikymą baltymų lankstymui (chemija), o Tiuringo apdovanojimas pagerbė novatoriškus indėlius į pastiprinimo mokymąsi.
Sudėtingas mąstymas išlieka iššūkiu. DI modeliai puikiai atlieka tokias užduotis kaip Tarptautinės matematikos olimpiados problemos, tačiau vis dar sunkiai susidoroja su sudėtingais mąstymo testais, tokiais kaip „PlanBench“. Jie dažnai negali patikimai išspręsti loginių užduočių net kai yra įrodomai teisingi sprendimai, o tai riboja jų veiksmingumą didelės rizikos situacijose, kur tikslumas yra gyvybiškai svarbus.



