Daboost / Shutterstock

Med nylig fyring og hurtig genansættelse af Sam Altman af OpenAI er debatter omkring udvikling og brug af kunstig intelligens (AI) igen i søgelyset. Hvad der er mere usædvanligt er, at et fremtrædende tema i medierapportering har været evnen til AI-systemer til at lave matematik.

Tilsyneladende var noget af dramaet på OpenAI relateret til virksomhedens udvikling af en ny AI-algoritme kaldet Q*. Systemet er blevet talt om som et betydeligt fremskridt, og et af dets fremtrædende funktioner var evnen til at ræsonnere matematisk.

Men er matematik ikke grundlaget for kunstig intelligens? Hvordan kan et AI-system have problemer med matematisk ræsonnement, givet at computere og regnemaskiner kan udføre matematiske opgaver?

AI er ikke en enkelt enhed. Det er et kludetæppe af strategier til at udføre beregninger uden direkte instruktion fra mennesker. Som vi vil se, er nogle AI-systemer kompetente til matematik.

En af de vigtigste nuværende teknologier, de store sprogmodeller (LLM'er) bag AI-chatbots som ChatGPT, har dog hidtil kæmpet for at efterligne matematiske ræsonnementer. Dette skyldes, at de er designet til at koncentrere sig om sproget.


indre selv abonnere grafik


Hvis virksomhedens nye Q*-algoritme kan løse usynlige matematiske problemer, så kan det godt være et væsentligt gennembrud. Matematik er en gammel form for menneskelig ræsonnement store sprogmodeller (LLM'er) har hidtil kæmpet for at efterligne. LLM er den teknologi, der ligger til grund for systemer som f.eks OpenAI's ChatGPT.

I skrivende stund er detaljerne i Q*-algoritmen og dens muligheder begrænsede, men yderst spændende. Så der er forskellige finesser, du skal overveje, før du betragter Q* som en succes.

For eksempel er matematik et fag, som alle beskæftiger sig med i forskelligt omfang, og det matematiske niveau, Q* er kompetent til, er fortsat uklart. Der er dog publiceret akademisk arbejde, der bruger alternative former for AI til at fremme matematik på forskningsniveau (herunder nogle skrevet af mig selv, og en skrevet af et team af matematikere i samarbejde med forskere hos Google DeepMind).

Disse AI-systemer kan beskrives som kompetente til matematik. Det er dog sandsynligt, at Q* ikke bliver brugt til at hjælpe akademikere i deres arbejde, men snarere er beregnet til et andet formål.

Ikke desto mindre, selvom Q* ikke er i stand til at skubbe grænserne for banebrydende forskning, er der højst sandsynligt en vis betydning at finde i den måde, den er blevet bygget på, som kan skabe fristende muligheder for fremtidig udvikling.

Stadig mere behagelig

Som samfund er vi mere og mere komfortable med, at specialiseret kunstig intelligens bliver brugt til at løse forudbestemte typer problemer. For eksempel, digitale assistenter, ansigtsgenkendelseog online anbefalingssystemer vil være bekendt for de fleste. Hvad der forbliver uhåndgribeligt er en såkaldt "kunstig generel intelligens" (AGI) der har brede ræsonnementer, der kan sammenlignes med et menneskes.

Matematik er en grundlæggende færdighed, som vi stræber efter at lære ethvert skolebarn, og vil helt sikkert kvalificere sig som en grundlæggende milepæl i søgen efter AGI. Så hvordan skulle matematisk kompetente AI-systemer ellers være til hjælp for samfundet?

Den matematiske tankegang er relevant for en lang række anvendelser, for eksempel kodning og teknik, og derfor er matematisk ræsonnement en vital overførbar færdighed for både menneskelig og kunstig intelligens. En ironi er, at AI på et grundlæggende niveau er baseret på matematik.

For eksempel koger mange af de teknikker, der implementeres af AI-algoritmer i sidste ende ned til et matematisk område kendt som matrix algebra. En matrix er simpelthen et gitter af tal, som et digitalt billede er et velkendt eksempel på. Hver pixel er intet andet end numeriske data.

Store sprogmodeller er også i sagens natur matematiske. Baseret på et stort udsnit af tekst kan en maskine lære sandsynligheden for de ord, der er mest sandsynligt at følge en prompt (eller spørgsmål) fra brugeren til chatbotten. Hvis du vil have en foruddannet LLM til at specialisere sig i et bestemt emne, så kan den finjusteres på matematisk litteratur eller ethvert andet læringsdomæne. En LLM kan generere tekst, der læser, som om den forstår matematik.

Desværre producerer dette en LLM, der er god til at bluffe, men dårlig til detaljer. Problemet er, at en matematisk udsagn per definition er en, der kan tildeles en entydig boolsk værdi (det vil sige sandt eller falsk). Matematisk ræsonnement svarer til den logiske udledning af nye matematiske udsagn fra de tidligere etablerede.

Djævlens advokat

Naturligvis vil enhver tilgang til matematisk ræsonnement, der er afhængig af sproglige sandsynligheder, køre uden for sin vognbane. En måde at omgå dette på kunne være at inkorporere et eller andet system med formel verifikation i arkitekturen (nøjagtig hvordan LLM er bygget), som løbende tjekker logikken bag springene fra den store sprogmodel.

Et fingerpeg om, at dette er blevet gjort, kunne være i navnet Q*, som plausibelt kunne henvise til en algoritme udviklet helt tilbage i 1970'erne at hjælpe med deduktiv ræsonnement. Alternativt kunne Q* referere til Q-learning, hvor en model kan forbedres over tid ved at teste for og belønne konklusioner, der er korrekte.

Men der er flere udfordringer ved at bygge matematisk dygtige AI'er. For eksempel består noget af det mest interessante matematik af meget usandsynlige begivenheder. Der er mange situationer, hvor man kan tro, at der eksisterer et mønster baseret på små tal, men det bryder uventet sammen, når man tjekker nok sager. Denne evne er svær at integrere i en maskine.

En anden udfordring kan komme som en overraskelse: matematisk forskning kan være yderst kreativ. Det skal det være, fordi praktikere skal opfinde nye koncepter og alligevel holde sig inden for formelle regler for et gammelt emne.

Enhver AI-metodologi, der kun er trænet til at finde mønstre i allerede eksisterende matematik, kunne formodentlig aldrig skabe ægte ny matematik. I betragtning af rørledningen mellem matematik og teknologi, synes dette at udelukke opfattelsen af ​​nye teknologiske revolutioner.

Men lad os lege djævlens advokat et øjeblik og forestille os, om AI virkelig kunne skabe ny matematik. Det tidligere argument imod dette har en fejl, idet det også kunne siges, at de bedste menneskelige matematikere også udelukkende blev uddannet i allerede eksisterende matematik. Store sprogmodeller har overrasket os før, og vil gøre det igen.The Conversation

Tom Oliver, underviser, datalogi og teknik, University of Westminster

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs oprindelige artikel.