„Mistral AI“ siūlo atvirojo kodo naują „Codestral“ didelės kalbos modelį kūrėjams

Dirbtinio intelekto startuolis „Mistral AI“ šiandien debiutavo Codestral – didelis kalbos modelis, optimizuotas programinės įrangos kūrimo užduotims atlikti.
Pradedama gauti pranešimai, kad bendrovė šiuo metu renka didelį naują finansavimo etapą. Anksčiau šį mėnesį šaltiniai „Wall Street Journal“ sakė, kad „Mistral“ iš investuotojų siekia 600 mln. USD už 6 mlrd. Tai trigubai tiek, kiek „Mistral“ buvo verta po paskutinio finansavimo ciklo gruodžio mėn.
Naujasis bendrovės Codestral modelis supranta daugiau nei 80 programavimo kalbų. Jo žinių bazėje yra vadinamųjų aukšto lygio kalbų, tokių kaip Python, kurios automatizuoja tam tikras kodavimo užduotis, kad pagerintų kūrėjo produktyvumą. Modelis taip pat gali rašyti programinę įrangą keliomis žemo lygio sintaksėmis, kurios leidžia programuotojams tiesiogiai sąveikauti su pagrindine aparatine įranga. Ši funkcija padeda atlikti tokias užduotis kaip programų našumo optimizavimas, tačiau jos mokymosi kreivė yra staigi.
„Mistral“ teigia, kad „Codestral“ tinka įvairioms kodavimo užduotims atlikti. Kūrėjai gali įkelti kodo fragmentą ir paprašyti modelio paaiškinti, ką jis daro. Be to, Codestral gali generuoti naują kodą pagal natūralios kalbos instrukcijas.
Modelis gali veikti kaip automatinio užbaigimo įrankis ir tęsti kūrėjo pradėtą rašyti kodo fragmentą. Jis taip pat gali modifikuoti jau užbaigtus programos komponentus. Pavyzdžiui, kūrėjas gali paprašyti Codestral pakeisti kolegos parašyto kodo fragmento vidurinę eilutę.
Kita užduotis, kurią žada palengvinti LLM, yra naujai sukurtos programinės įrangos tikrinimas dėl klaidų.
Kai kurios klaidos neleidžia įkelti programai, o kitos atsiranda tik tada, kai vartotojai atlieka tam tikrą veiksmų seką programos sąsajoje. Pastarojo tipo problemą gali būti labai sudėtinga aptikti naudojant rankinio trikčių šalinimo metodus. Anot „Mistral“, kūrėjai gali naudoti Codestral, kad automatiškai nuskaitytų savo kodą, ar nėra trūkumų, ir taip pagreitintų procesą.
Codestral turi 22 milijardus parametrų. Atlikdama vidinį vertinimą, „Mistral“ palygino jį su trimis kitais atvirojo kodo LLM, įskaitant „Meta Platforms Inc.“ Llama 3 70B, kuriame yra daugiau nei tris kartus daugiau parametrų. Codestral pasirodė labiau prisitaikantis nei visi trys modeliai atliekant Python programavimo užduotis ir gavo antrą aukščiausią balą teste, kuriame buvo vertinamas jų SQL gebėjimas.
Vienas iš LLM našumo veiksnių yra didelis konteksto langas. Codestral gali apdoroti raginimus su iki 32 000 žetonų, daugiau nei dvigubai daugiau nei įvesties duomenų, palaikomų Llama 3 70B. Tai leidžia buvusiam LLM lengviau analizuoti didelius kodo failus, kuriuose yra iki šimtų programų logikos eilučių.
„Codestral“ yra prieinama pagal atvirojo kodo licenciją tyrimų ir bandymų tikslais. Organizacijos, norinčios naudoti modelį komerciniuose programinės įrangos projektuose, gali prieiti prie jo per debesyje pagrįstą taikomųjų programų programavimo sąsają, kurią teikia „Mistral“. Bendrovės teigimu, API tinka tokioms užduotims kaip programavimo automatizavimo įskiepių kūrimas kodo redagavimo programoms.
Vaizdas: Atskleiskite purslą
Jūsų balsas už paramą mums yra svarbus ir padeda mums išlaikyti turinį NEMOKAMĄ.
Vienu paspaudimu toliau palaikome mūsų misiją teikti nemokamą, išsamų ir aktualų turinį.
Prisijunkite prie mūsų bendruomenės „YouTube“.
Prisijunkite prie bendruomenės, kurią sudaro daugiau nei 15 000 #CubeAlumni ekspertų, įskaitant Amazon.com generalinį direktorių Andy Jassy, „Dell Technologies“ įkūrėją ir generalinį direktorių Michaelą Delą, „Intel“ generalinį direktorių Patą Gelsingerį ir daugybę kitų šviesuolių bei ekspertų.
AČIŪ