Bent u geïnteresseerd in hen? AANBIEDINGEN? Bespaar met onze coupons op WhatsApp o TELEGRAM!

Llama 3 daagt de reuzen uit: hier is Meta's nieuwe AI-model

April 18 2024

Meta heeft twee nieuwe toegevoegd linguïstische modellen naar zijn serie: Lama 3 8B e Lama 3 70B. Deze beloven superieure prestaties in de wereld van kunstmatige intelligentie. Het meest opvallende nieuws? De aanwezigheid van respectievelijk 8 miljard en 70 miljard parameters. Deze cijfers vertegenwoordigen de complexiteit en het vermogen van het model om met en om te gaan verwerken informatie.

Llama 3 bestaat niet uit slechts twee modellen: er komt nog meer materiaal

Meta stopt daar niet; plannen om breng meer modellen uit in de Llama 3-serie, maar zonder een datum op te geven. Deze strategie schept anticipatie en toont ook de toewijding van het bedrijf aan het voortdurend verbeteren van zijn aanbod.

I nieuwe lama-modellen ze worden beschreven als een sprong ten opzichte van eerdere modellen. Deze verbetering is deels te danken aan het gebruik van twee aangepaste GPU-clusters, elk met 24.000 eenheden, waardoor modellen effectiever en nauwkeuriger konden worden getraind. Meta beweert dat deze modellen dat wel zijn, vanwege het aantal parameters dat ze bezitten een van de beste die beschikbaar zijn vandaag voor generatieve kunstmatige intelligentie.

De prestaties van Llama 3 werden gemeten via verschillende AI-benchmarks, dit zijn gestandaardiseerde tests die worden gebruikt om de mogelijkheden van AI-modellen te evalueren. Deze omvatten MMLU voor kennis, ARC voor het verwerven van vaardigheden, bijv DROP om te redeneren over tekstblokken. Hoewel de meningen verschillen over het nut van deze benchmarks, blijven ze een gebruikelijke methode voor het evalueren en vergelijken van de mogelijkheden van AI-modellen.

Met name Llama 3 8B presteerde beter dan vergelijkbare open source-modellen met minder parameters, zoals Mistral en Google Gemma, in ten minste negen verschillende benchmarks. Dit omvat tests over algemene kennis, redeneren en specifieke vaardigheden op gebieden als biologie, natuurkunde, scheikunde en zelfs het genereren van codes en wiskundige problemen. Welke GPT-4 bijvoorbeeld niet zo goed kan.

Het grootste model, Llama 3 70B, concurreert niet alleen, maar overtreft in sommige gevallen vlaggenschipmodellen zoals Gemini 1.5 Pro van Google in verschillende tests is gebleken dat het ondanks de sterke concurrentie zelfs de reuzen van de sector kan weerstaan. Het is echter belangrijk op te merken dat het weliswaar beter presteert dan sommige vlaggenschipmodellen, zoals Claude 3 Sonnet van Anthropic in verschillende tests haalt het niet de prestaties van het meer geavanceerde Claude 3 Opus-model.