Patronus AI debiutuoja generatyvūs simuliatoriai, palaikantys nuolatinę AI agentų evoliuciją ir tobulinimą


Dirbtinio intelekto modelių mokymo ir testavimo įrankių startuolis Patronus AI Inc. šiandien paskelbė apie naujo pasiūlymo, pavadinto „Generatyvieji simuliatoriai“, prieinamumą, skirtą padėti įvertinti ir tobulinti autonominius AI agentus.
Naujieji treniruokliai yra pagrindinis Patronus AI sustiprinimo mokymosi aplinkų elementas. Tai modeliuojami pasauliai, leidžiantys kruopščiai išbandyti AI agentus. Jie gali pritaikyti šiuos modeliavimus skraidydami, nuolat kurdami naujas užduotis, scenarijus ir taisykles, siekdami užtikrinti, kad dirbtinio intelekto agentai nuolat mokytųsi naujų dalykų ir niekada nenustygtų.
Patronus AI RL aplinkose dirbtinio intelekto agentai gali išmokti naujų įgūdžių ir gebėjimų per bandymus ir klaidas virtualioje aplinkoje, kuri imituoja realias darbo eigas. Kiekviena aplinka apima konkrečiam domenui būdingas taisykles, geriausią praktiką ir patikrinamą atlygį, skatinantį dirbtinio intelekto agentus optimizuoti savo našumą atliekant įvairias su darbu susijusias užduotis. Jie leidžia kūrėjams atskleisti agentams naujų rūšių samprotavimo iššūkius ir trukdžius, todėl laikui bėgant jie gali tobulėti. Jie taip pat padeda įvertinti AI agentų įgūdžius.
Startuolis teigia, kad dirbtinio intelekto agentų mokymas ir jų tobulinimas laikui bėgant išlieka pagrindiniu modelių laboratorijų iššūkiu. AI agentai yra sukurti savarankiškai atlikti užduotis su minimalia žmogaus priežiūra, todėl jie yra visiškai kitoks žaidimas, palyginti su standartiniais generatyviais AI pokalbių robotais.
Viena iš pagrindinių problemų yra ta, kad statiniai testai ir mokymo duomenys, naudojami kuriant didelius kalbos modelius, naudojamus AI agentams, neatspindi dinamiško ir interaktyvaus realaus darbo eigos pobūdžio. Dėl to agentai, kurie gerai atlieka statinius etalonus, gali subyrėti, kai jie naudojami realiame pasaulyje ir keičiasi užduoties reikalavimai. Agentai taip pat turi išmokti sėkmingai naudoti trečiųjų šalių įrankius ir išlikti kelyje ilgą laiką.
Patronus AI vienas iš įkūrėjų ir generalinis direktorius Anandas Kannappanas teigė, kad tradiciniai etalonai yra tinkami atskiroms AI modelių galimybėms įvertinti, tačiau juose neatsižvelgiama į nuolatinį konteksto perjungimą, trikdžius ir daugiasluoksnį sprendimų priėmimą, kurie atsiranda jiems dirbant. „Kad agentai galėtų atlikti užduotis lygiu, lygiu su žmonėmis, jie turi išmokti taip, kaip tai daro žmonės – per dinamišką, grįžtamuoju ryšiu pagrįstą patirtį, kuri atspindi realaus pasaulio niuansus“, – sakė jis.
Vertinimus atlieka Patronus AI Glider LLM, kuris buvo specialiai sukurtas kaip greitas, nešališkas ir labai lankstus trečiųjų šalių AI modelių „teisėjas“. Jei reikia kokių nors patobulinimų, juos gali atlikti „Percival“ – antrasis bendrovės sukurtas modelis, skirtas dirbtinio intelekto gedimams aptikti ir automatiškai pašalinti. „Percival“ automatizuoja šį procesą, analizuodama agento darbo eigas, kad nustatytų bet kokius konkrečius poveiksmius, kurie sukelia problemų, prieš pasiūlydama būdą, kaip jį išspręsti.
Naujieji generaciniai simuliatoriai yra skirti palengvinti tokio pobūdžio mokymąsi. Jie gali generuoti naujas agentams „užduotis“ kartu su aplinkinėmis sąlygomis, priežiūros procesu ir pan., o vėliau jas nuolat pritaikyti pagal agento elgesį.
Taigi vietoj fiksuotos treniruočių aplinkos jie veikia labiau kaip „gyvas praktikos pasaulis“, kuris nuolat kuria vis naujus ir aktualesnius iššūkius bei grįžtamąjį ryšį. Bendrovė teigė, kad dirbtinio intelekto agentai niekada nenustoja mokytis ir tobulėti.
Simuliatoriai taip pat palaiko naują treniruočių techniką, kurią sukūrė Patronus AI, kuri vadinama Open Recursive Self-Improvement arba ORSI. Savo mokymo aplinkoje ORSI leidžia agentams pagerinti savo naujų užduočių atlikimą sąveikaujant ir grįžtant, nereikalaujant viso perkvalifikavimo ciklo tarp bandymų.
„Kai kodavimo agentas gali išskaidyti sudėtingą užduotį, susidoroti su blaškančiomis aplinkybėmis, derinti su komandos draugais prioritetus ir patikrinti savo darbą, tada matome tikrąją vertę“, – sakė AI vyriausioji technologijų pareigūnė Rebecca Qian. „Mūsų RL aplinkos suteikia pagrindų modelių laboratorijoms mokymo infrastruktūrą, skirtą sukurti agentus, kurie ne tik gerai atlieka iš anksto nustatytus testus, bet ir dirba realiame pasaulyje.
Vaizdas: Patronus AI
Palaikykite mūsų misiją, kad turinys būtų atviras ir nemokamas, bendradarbiaudami su CUBE bendruomene. Prisijunkite prie theCUBE Alumni Trust tinklokur technologijų lyderiai jungiasi, dalijasi intelektu ir kuria galimybes.
- Daugiau nei 15 mln. „CUBE“ vaizdo įrašų žiūrinčiųjųskatina pokalbius naudojant AI, debesį, kibernetinį saugumą ir kt
- 11,4 tūkst.+ theCUBE absolventų — Susisiekite su daugiau nei 11 400 technologijų ir verslo lyderių, formuojančių ateitį per unikalų patikimą tinklą.
Apie SiliconANGLE Media
„SiliconANGLE Media“, kurią įkūrė technologijų vizionieriai Johnas Furrier ir Dave'as Vellante, sukūrė dinamišką pramonėje pirmaujančių skaitmeninės medijos prekių ženklų ekosistemą, kuri pasiekia daugiau nei 15 milijonų elitinių technologijų profesionalų. Mūsų naujasis patentuotas theCUBE AI Video Cloud veržiasi į auditorijos sąveiką, panaudodamas CUBEai.com neuroninį tinklą, kad padėtų technologijų įmonėms priimti duomenimis pagrįstus sprendimus ir išlikti pramonės pokalbių priešakyje.