Kort introduktion til AI modeller
Vi har i flere år haft LLM'er med en chatbot ovenpå som ChatGPT (OpenAI), Claude (Anthropic), og Gemini (Google), som vi uden tvivl alle har eksperimenteret med på kryds og tværs. Jeg er sikker på, at du -- ligesom mig -- både er begejstret for mulighederne og frustreret (eller måske endda bekymret) over, hvor galt det kan gå, når en chatbot og dens underliggende LLM hallucinerer (forklaring fra ChatGPT) og svarer helt forkert.
Warning
Bemærk venligst hvornår denne artikel er skrevet. AI-teknologi udvikler sig hurtigt, og det, der er sandt i dag, kan være forældet i morgen.
Indgangen for mange til AI er netop ChatGPT, men det er jo absolut ikke den eneste spiller på markedet, og skal vi til at bygge vores egen "AI App", skal der en del mere til. Men nu kan vi starte serien med at sætte et par grundlæggende begreber på plads inden de efterfølgende indlæg.
GPT
Man taler ofte om GPT som en generel AI-teknologi, men det er faktisk ikke korrekt. GPT står for Generative Pre-trained Transformer og er en type sprogmodel (Large Language Model eller LLM) udviklet af OpenAI. Disse modeller er trænet på enorme mængder tekstdata og kan generere menneskelignende tekst baseret på de input, de modtager. ChatGPT er en applikation bygget oven på GPT-modellen. Den er finjusteret til at føre samtaler og er designet til at være mere interaktiv og brugervenlig. ChatGPT inkluderer også funktioner som indholdsfiltrering og kontekststyring for at forbedre brugeroplevelsen.
Der er andre spillere på banen
Det er vigtigt at bemærke, at GPT ikke er den eneste teknologi inden for LLM'er. Flere andre virksomheder har udviklet deres egne modeller, og disse modeller viser, at AI-feltet er mangfoldigt, og at der findes flere forskellige tilgange og teknologier ud over GPT. GPT er blot OpenAI's måde at designe en model.
Eksempelvis har Gemini (Google), Claude (Anthropic), LLaMA (Meta), Mistral (et europæisk AI-firma - måske burde man kigge mere her i disse tider?), DeepSeek (kinesisk), Phi (Microsoft) med videre forskellige typer af modeller, både med og uden open source-licens, der er effektive og tilgængelige for private og virksomheder. Disse alternativer adskiller sig fra GPT ved deres træningsdata, modelarkitektur og licensstrategier -- og giver brugerne mulighed for at vælge en model, der passer til deres behov og værdier.
Dagens udfordring
Nok teori - udfordringen til dette indlæg kunne være: Opret (eller tilknyt) en konto hos OpenAI, Anthropic og/eller Google, og bed den om at forklare begreberne - start med en prompt som eksempelvis:
Du er en AI-instruktør: Definer forskellen mellem LLM, GPT, ChatGPT, Claude,
LLaMA og Gemini med 1–2 sætninger hver, efterfulgt af en klar
sammenligningstabel med ejer, træningsdata, åben/kommerciel status og
nøglefunktioner, dernæst beskriver du kort deres historiske og tekniske
relationer, og du afrunder med én enkel analogi eller huskeregel,
så svaret både er let at forstå og huske.
Prøv prompten i de forskellige modeller hos den enkelte udbyder og hos forskellige udbydere. Læg mærke til, at nogle modeller er deciderede "chat"-modeller og andre er "tænke"-modeller (reasoning) - prøv at se forskellen i svar mellem de to typer.
Promptgenerering -- øv dig på det. Jo bedre du er til det, jo større bliver udbyttet, når du "taler" med en model. Fremtidens IT‑medarbejdere kunne meget vel bestå af ansatte, som forstår, hvordan de kan få det rette udbytte fra en model. Udover den tekniske indstilling af parametre mv. handler det primært om at kunne skrive en god prompt.
Og er du mere interesseret, så prøv:
En chat-model er som en venlig receptionist: god til samtale og hurtig
til at svare. En 'tænke'-model minder om en specialist, der kan analysere
komplekse problemer. Mange AI-modeller kombinerer nu begge egenskaber:
samtale og avanceret problemløsning. Udviklingen går mod alsidige
modeller, der kan håndtere både dialog og svære opgaver.
Du kunne også i de forskellige modeller og udbydere, prøve den klassiske: