Språkrobotarna som ger en ny digital framtid

En digital uppstickare håller på att förändra en av internets grundpelare. Samtidigt försöker en svensk idé rida på framgångsvågen. Men är allmänheten redo för ett nytt nät?
–Nu måste vi ställa om, säger en expert på området.

Fysiska robotar har väldigt lite att göra med de språkrobotar som kan komma att revolutionera internetanvändandet för många. Arkivbild.

Fysiska robotar har väldigt lite att göra med de språkrobotar som kan komma att revolutionera internetanvändandet för många. Arkivbild.

Foto: Rick Bowmer/AP/TT

Tech2023-01-23 05:50

Minns du Altavista? I internets barndom blev söktjänsten omsprungen av Google som verktyget alla använde för att ta reda på saker. Nu mumlas det från olika hörn av nätet att det kan vara Googles tur att bli förbipasserad. Nykomlingen heter Chat GPT och representerar något som Google riskerar att försvinna från: framtiden.

Chat GPT, utvecklat av Elon Musk-grundade Open AI, är en så kallad textrobot. Den kan generera text på ett hittills icke uppnått sätt både vad gäller innehåll och användarvänlighet. Tekniken är varken superny eller felfri, och de bakomliggande algoritmerna fortsatt okända, men resultatet är en tjänst som, något förenklat, kan ge information samtidigt som den för ett samtal med dig. Du behöver alltså inte formulera din fråga lika precist som Google i dagsläget kräver. Det räcker med "fiskrecept till middag" och du får igång en dialog med tjänsten.

– Den här typen av språkmodeller kommer att bli viktiga för samhället. För oss datavetare handlar det om att vara snabbfotade, att vara beredd på att omvärdera allt hela tiden, säger Daniel Gillblad som ansvarar för forskning och strategi på AI Sweden, Sveriges nationella center för artificiell intelligens.

Konversation med data

Det svenska initiativet heter GPT SW3 och verkar lite i utkanten av de stora futuristiska penseldragen men bygger på liknande teknik som gjort Chat GPT till techvärldens senaste fenomen. GPT SW3 kan möjligen komma att revolutionera såväl skolväsendet som den offentliga vardagen i Sverige.

– Vi vill skapa en basmodell som är så generell som möjligt och som fungerar för så många domäner i ett svenskt sammanhang som möjligt, säger Francisca Hoyer, strategisk programledare för språkteknologi på AI Sweden.

Såväl Chat GPT som GPT SW3 bygger vidare på en gammal sanning inom internet och tech: allt handlar om data. Data som i information. Har du information har du makt. Har du dessutom en begriplig produkt har du en guldgruva.

"Konversationen" i Chat GPT bygger på att roboten, eller mer precist AI-språkmodellen, vet hur "samtalet" mest troligt kommer fortsätta – baserat på den textdata den använder som bränsle. Det är helt enkelt troligare att du frågar om priset på lax och var du kan köpa den efter att ha ställt middagsfrågan än vad det är att du frågar om vad dvärgen i "Sagan om ringen" heter (Gimli).

– Chat GPT tänker inte själv. Vad är det den spottar ur sig? Det är statistik, statistik fördelning av text, säger Francisca Hoyer.

Svensk inställning

"Robotkonkurrenter" till Chat GPT existerar redan i olika form, alltifrån Apples Siri till Googles egna chattrobot. Det som är unikt för Open AI:s lösning är att den klarar av att sammanfatta exempelvis forskningsrapporter samtidigt som den kan komponera en dikt om två elefanter som dansar rumba. Allt med hjälp av den massiva mängd data, text, som den tränats på. Och den gör det på ett sätt som är lättillgängligt för genomsnittsanvändaren.

GPT SW3 är inte lika kommersiell. I stället är tanken att utveckla en svensk grundplåt varifrån aktörer kan skapa egna lösningar. Oavsett om det blir en chattrobot i vården, ett verktyg som kategoriserar mejl eller något som automatiskt skriver produktbeskrivningar, sportnotiser eller sammanfattning av hemtentan.

– Jag är jättenyfiken på vad forskare och samarbetspartners kommer vilja göra med modellen, säger Francisca Hoyer.

Just att bjuda in till samarbete kring att utveckla GPT SW3 får modellen att skilja sig från Chat GPT.

– Open AI erbjuder just nu väldigt fina gränssnitt som är gratis. Men det är inte så att folk kan gå in i själva parametrarna i modellen och ändra och förstå. Det kan vi göra här. Vi erbjuder hela modellen. Möjligheterna för vidare utveckling och forskning är på en annan skala när vi gör så här, säger Daniel Gillblad.

Urvalsprocess

Att bygga en språkmodell på svenska skiljer sig från att göra det på engelska även på det mest grundläggande planet, tillgången till data är mer begränsad.

– Chat GPT klarar av svenska, men vi vet inte varifrån datan kommer. Om det är Google-sökningar eller Wikipedia eller något annat. Vi jobbar på ett annat sätt, transparent, säger Francisca Hoyer.

Ett medvetet val från AI Swedens sida är att inte enbart ha "högkvalitativa textkällor" när det kommer till att mata modellen med data.

– En modell enbart tränad på myndighetssvenska skulle inte vara en bra chattrobot exempelvis. Det är viktigt att det inte bara är finsvenska, utan också med lite stavfel och liknande.

Bland datakällorna för GPT SW3 återfinns forumen Flashback, Familjeliv och delar av Reddit. Att innehållet där kan vara både rasistiskt och sexistiskt oroar inte.

– Vi är fullt medvetna om problematiken. Det visar hur viktigt det är att ha koll på träningsdatan. Det gäller alla datakällor, säger Francisca Hoyer.

Daniel Gillblad fyller i:

– En viss typ av partiskhet kan spela roll i modeller som förutser genetiska sjukdomar exempelvis, men är inte relevant om vi pratar om arbetsintervjuer. Om modellen ska vara grunden för väldigt många tillämpningar kan man inte plocka bort saker från början.

Fakta: Chat GPT

Chat GPT har skapats av företaget Open AI och är en textrobot som tränats i att generera text. Den kan enligt utvecklarna svara på uppföljningsfrågor och rätta sig själv.

Roboten har lärt sig konversera genom att analysera enorma mängder texter från internet, den fick stort genomslag under hösten 2022.

Open AI grundades 2015 av några techentreprenörer, bland andra nuvarande vd:n Sam Altman samt Elon Musk och är baserat i San Francisco. Uppdraget är att bygga artificiell intelligens som ska vara till nytta för mänskligheten.

Företaget jobbar för tillfället på den fjärde versionen av tjänsten, som ryktas lanseras under 2023 och klara än mer avancerade saker än den version som nu finns tillgänglig för testning.

Fakta: Open AI


Fakta: GPT SW3

GPT SW3 är en så kallad språkmodell som bygger på artificiell intelligens (AI). GPT är en förkortning som handlar om vilken typ av AI det är som används och SW3 är ett "internskämt" som uttalas swe, Sverige på engelska, där trean symboliserar tredje "generationens" GPT.

Språkmodellen är ett samarbete mellan AI Sweden, Rise och Wallenberginitiativet Wasp.

Modellen bygger på data från svenska och nordiska språk från bland annat Fass, 1177, Litteraturbanken, Wikipedia, Flashback, Familjeliv och Reddit.

Källa: AI Sweden


Fakta: Artificiell intelligens

Tanken med artificiell intelligens (AI) är att på konstgjord väg efterlikna hjärnans förmåga att inhämta kunskap, dra slutsatser, planera, lösa problem eller att tolka resultat.

AI är vanligt förekommande i fiktion och tar då ofta en form som är långt ifrån var tekniken befinner sig i verkligheten. En mänskligt tänkande robot anses i vetenskaplig bemärkelse i princip omöjlig. AI blir dock allt vanligare i vardagen i allt från så kallade chattrobotar som kan användas i kundtjänster till analyserande AI som ur en stor mängd data kan komma fram till en diagnos eller optimal färdväg.

Forskningsområdet fick sitt namn under 1950-talet och har inslag av matematik, informationsteknik, filosofi, lingvistik, psykologi, kognitionsvetenskap och hjärnforskning. Verktygen är oftast algoritmer av olika slag, där en algoritm kan beskrivas som en systematisk procedur som i ett antal steg anger hur ett visst problem ska beräknas eller analyseras. Exempelvis en karttjänst i mobilen som ger förslag på snabbaste bilväg till ett specifikt resmål baserat på tillgänglig data om distans och trafiksituation.

Källa: Nationalencyklopedin, Nature

Så jobbar vi med nyheter  Läs mer här!