Vad fasen är en AI agent egentligen?

Tänk att ha en AI-agent som håller reda på kalendern, mailen (alla mail och kalendrar, både privata och jobbets), ger mig tips på var jag ska lägga fokus, ser till att jag kommer ihåg att hämta barn, betala in till klasskassan och kanske till och med påminner mig om att andas ibland.

Det låter lite som magi och jag har varit sjukt nyfiken på att prova. 

Lite bakgrund

Jag är fortfarande ganska mycket nybörjare här, även om jag jobbat länge med ChatGPT som någon slags digital kollega. Men kanske är det faktiskt en fördel. Jag har själv tyckt att det varit svårt att förstå vad en AI-agent egentligen är, och då kanske jag också kan hjälpa andra nybörjare att förstå lite mer.

Idag föddes Frida 0.2

Idag har jag alltså suttit och lekt med min egen AI-agent Frida. Eller ja… visionen av en agent i alla fall. Men vad är en agent egentligen. Om Frida bara hade varit en GPT så hade hon egentligen mest kunnat prata med mig. Hon hade kunnat resonera, ge råd, hjälpa mig tänka, planera och sammanfatta saker. Men bara utifrån det jag själv berättade för henne i stunden. Hon hade däremot inte kunnat läsa min kalender, analysera mina mail, följa upp saker automatiskt eller skicka meddelanden till mig i Slack. Hon hade heller inte kommit ihåg saker över tid om jag inte själv matade in allt igen.

Det är den möjligheten agenten skapar. Jag har faktiskt bett ChatGPT coacha mig genom arbetet. Det har varit rätt kul. I början sänkte den mina ambitioner alldeles för mycket så att det blev tråkigt. Då blev jag sur och gav feedback. Några dagar senare var vi igång igen. Och idag kom något av ett genombrott.

Det hände när jag började leka med plattformen Make. Det var först då jag började förstå hur saker och ting faktiskt hänger ihop. Eller ja… det som jag just nu tror är helheten. Jag är ganska säker på att specialisterna kommer kunna rätta mig i kommentarerna senare.

Vad är Make egentligen?

Det visste jag inte riktigt när jag började. Men när jag började förstå vad Make faktiskt gör så började också helheten falla på plats.

Make är som ett nav där jag kan koppla ihop olika saker. I mitt fall handlar det om mail, kalender och Slack. Men Make ger mig också möjlighet att koppla in AI-modeller som kan tolka och analysera informationen från de systemen, alltså logiken kring hur saker ska hänga ihop och vad som ska hända härnäst.

Den här delen är egentligen inte “smart”. Den fungerar mer som trafikledning mellan olika system.

När kommer AI in då?

Det är här språkmodellerna, alltså LLM, kommer in. Det är de som står för själva intelligensen. Det är där resonemanget sker. I mitt fall använder jag  ChatGPT-o4-mini just nu. Varför? Helt ärligt vet jag inte riktigt. Den verkade snabb och billig och jag tänkte att det inte var raketforskning vi skulle jobba med.

Det jag gör är egentligen att ge modellen instruktioner kring vilken roll den ska ha, hur den ska tänka, vilket format jag vill ha svaren i och vilket data den ska analysera.

I mitt fall är instruktionen ungefär:

“Hjälp Johan att få ordning på livet.”

Jag har skrivit ut den prompten lite mer utvecklat samt att jag ger den regler för hur den skall kommunicera med mig. Men då uppstår nästa fråga:

Var kommer datat ifrån?

Externa funktioner och subagenter

Här kommer kalendern, mailen och alla andra system in.

Jag behöver ge Make tillgång till mina verktyg. Känns på riktigt lite läskigt men de flesta har väldigt väl utvecklade APIer (alltså kommunikationskanaler) för detta. I mitt fall handlar det om Google Kalender, Gmail och Slack, men det skulle kunna vara nästan vad som helst.

Sedan hämtar Make informationen och skickar den vidare till AI för analys och tolkning. Och nu börjar det bli lite rörigt, eller hur? Tyvärr slutar det inte där.

Jag behöver också bestämma hur agenten ska prata med mig tillbaka. I mitt fall skapade jag en Slack-kanal som heter #frida.

Så Slack blir egentligen bara platsen där vi kommunicerar. Det hade lika gärna kunnat vara WhatsApp, Teams, mail eller SMS.

Det stora mysteriet: minnet

Den sista delen har jag faktiskt inte byggt än. Men ganska snabbt inser man att det här inte blir särskilt bra om agenten inte minns något. Jag vill ju att Frida ska lära sig mina mönster, förstå hur jag fungerar, komma ihåg tidigare saker och utvecklas över tid. Och då behövs någon form av minne.

Något som sparar erfarenheter, preferenser och tidigare konversationer. Det är nog här det börjar gå från “smart automation” till något som faktiskt känns som en agent.

Dit har jag inte kommit än. Men ge mig någon månad så kanske Frida börjar få minne också.

Så… vad är en AI-agent då?

Just nu, i min ganska förenklade nybörjarvärld, känns det som att en agent består av fyra delar.

  • Orkestrering och routing
    För att koppla ihop allt
  • LLM
    För intelligens och resonemang
  • Externa funktioner och subagenter
    För att hämta data och utföra saker
  • Minne
    För att kunna lära sig över tid

Och ärligt talat… Det är först nu jag börjar förstå att AI-agenten inte är själva AI-modellen. Det är hela systemet runt omkring.

Slutnot

Snälla alla AI experter därute hjälp mig om mina förenklingar leder mig fel.

6 reaktioner på ”Vad fasen är en AI agent egentligen?”

  1. Det här var en av de tydligaste förklaringarna jag sett av vad en agent faktiskt är. Det är lätt att hitta artiklar som förklarar vad AI kan göra, men du förklarar hur bitarna hänger ihop, och det är en helt annan sak.

    “AI-agenten är inte AI-modellen. Det är hela systemet runt omkring.” Den meningen borde stå på en skylt någonstans.

    Ser fram emot att följa Fridas utveckling, särskilt när minnet kommer in i bilden. Det är nog där det verkligen börjar bli intressant.

    /Jeff

    1. Härligt att höra. Kul att den förtydligade konceptet för dig! Lovar att återkomma när hon utvecklas 😀 Minnet är lite stök. Måste eventuellt börja leka med Claude Code då… HJÄÄÄLP Eller hitta någon databaslösning. Det är nu jag börjar bli riktigt rädd. Men Calude kanske hjälper mig med det 😀

  2. Tack för en tydlig översikt, det känns som jag förstår allt med ens.
    Vad hoppas du att Frida ska kunna hjälpa dig med när hon fått minne?
    Ser precis som Jeff fram emot att följa Fridas utveckling.
    Hälsningar Malin

    1. Vill att hon håller koll på vad jag har framför mig. Hjälper mig med en struktur, kollar mail (speciellt den privata) hjälper mig med balans, pauser och fokus!

  3. Martin Andersson

    Det här låter som ett kul sätt att lära sig, och ett pedagogiskt sätt att skriva om det. Snyggt!
    Men själv skulle jag nog inte våga ge en agent direkt tillgång till min privata mejl. Det lär ju öka sårbarheten om fler än jag med min tvåfaktorautentisering skulle få tillgång till en adress där det potentiellt skulle gå att skicka återställningslösenord från andra sajter.
    Nu verkar det ju dock som att alla som leker med agenter struntar i de säkerhetsbitarna, så jag kan tänka mig att vi får läsa om lite intressanta problem framöver.

    1. Det är ett kul sätt att lära sig och visst känns det lite läskigt att ge access till en tjänst till mailen. Men va fasen!

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig om hur din kommentarsdata bearbetas.