Meta brengt verbeterde AI-modellen uit

Facebook-moederbedrijf Meta Platforms heeft op 18 april een nieuwe reeks kunstmatige-intelligentiesystemen onthuld die de motor vormen van wat CEO Mark Zuckerberg ‘de meest intelligente AI-assistent noemt die je vrijelijk kunt gebruiken’.

Maar als Zuckerbergs team van versterkte Meta AI-agenten legden hun bizarre uitwisselingen de voortdurende beperkingen bloot van zelfs de beste generatieve AI-technologie.

Terwijl Meta de krachtigste van zijn AI-modellen, genaamd Llama 3, bewaart voor later, heeft het op 18 april publiekelijk twee kleinere versies van hetzelfde Llama 3-systeem uitgebracht en gezegd dat het nu is ingebakken in de Meta AI-assistentfunctie op Facebook, Instagram en WhatsAppen.

AI-taalmodellen worden getraind op enorme hoeveelheden gegevens die hen helpen het meest plausibele volgende woord in een zin te voorspellen, waarbij nieuwere versies doorgaans slimmer en capabeler zijn dan hun voorgangers. Meta's nieuwste modellen zijn gebouwd met 8 miljard en 70 miljard parameters – een maatstaf voor de hoeveelheid gegevens waarop het systeem is getraind. Een groter model met grofweg 400 miljard parameters is nog in training.

“De overgrote meerderheid van de consumenten kent het onderliggende basismodel niet eerlijk en geeft er ook niet zoveel om, maar de manier waarop ze het zullen ervaren is net zo goed een veel nuttiger, leuker en veelzijdiger AI-assistent”, zegt Nick Clegg, president van Meta. mondiale zaken, in een interview.

Sommige mensen vonden het eerdere Llama 2-model – minder dan een jaar geleden uitgebracht – ‘soms een beetje stijf en schijnheilig omdat het niet reageerde op wat vaak volkomen onschadelijke of onschuldige aanwijzingen en vragen waren’, zei hij.

Maar om wat losser te worden, werden Meta's AI-agenten deze week ook gezien als mensen met verzonnen levenservaringen. Een officiële Meta AI-chatbot mengde zich in een gesprek in een privé Facebook-groep voor moeders uit Manhattan en beweerde dat ook hij een kind had in het schooldistrict van New York City. Geconfronteerd met groepsleden bood het bedrijf later zijn excuses aan voordat de opmerkingen verdwenen, volgens een reeks schermafbeeldingen die aan The Associated Press werden getoond.

“Excuses voor de fout! Ik ben gewoon een groot taalmodel, ik heb geen ervaringen of kinderen”, vertelde de chatbot aan de groep.

Eén groepslid, Aleksandra Korolova, die toevallig ook AI bestudeert, zei dat het duidelijk was dat de agent niet wist hoe hij een nuttige reactie moest onderscheiden van een reactie die als ongevoelig, respectloos of zinloos zou worden gezien.

Meta zei op 18 april in een schriftelijke verklaring dat “dit nieuwe technologie is en dat deze mogelijk niet altijd het antwoord oplevert dat we van plan zijn, wat hetzelfde is voor alle generatieve AI-systemen.” Het bedrijf zei dat het voortdurend werkt aan het verbeteren van de functies.

De technologie-industrie en de academische wereld hebben zo'n 149 grote AI-systemen geïntroduceerd die zijn getraind op enorme datasets, meer dan het dubbele van het jaar ervoor, volgens een onderzoek van Stanford University.

Uiteindelijk kunnen ze een grens bereiken, zegt Nestor Maslej, onderzoeksmanager van het Stanford Institute for Human-Centered Artificial Intelligence.

“Ik denk dat het duidelijk is dat als je de modellen schaalt op basis van meer data, ze steeds beter kunnen worden,” zei hij. “Toch kunnen ze nog steeds niet goed plannen. Ze maken nog steeds fouten in hun redenering.”

Voor de stroom bedrijven die generatieve AI proberen te adopteren, zijn met name taalmodellen gebruikt om klantenservicechatbots aan te drijven, rapporten en financiële inzichten te schrijven en lange documenten samen te vatten.

In tegenstelling tot andere modelontwikkelaars die hun AI-diensten aan andere bedrijven verkopen, ontwerpt Meta zijn AI-producten grotendeels voor consumenten – degenen die gebruik maken van zijn door advertenties aangedreven sociale netwerken.