Norske språkmodeller
Norge har et aktivt miljø for åpne språkmodeller — fra Nasjonalbibliotekets
Borealis-serie til NorwAI fra NTNU og NORA.LLM-initiativet. Denne siden
gir oversikt over modeller som finnes i dag og hva som er på vei.
Sist oppdatert: 23. mai 2026.
📢 Nytt mai 2026
- NB-Llama-3.2 (1B og 3B) fra NbAiLab — optimalisert for bokmål, nynorsk og nordiske språk. Lansert april, nå i aktiv bruk.
- NorMistral-11B-long — utvidet kontekstvindu for lengre dokumentbehandling.
- NorwAI 7B og 45B fra NTNU er i aktiv produksjonsdrift i Norden.
- Borealis-familien fra NbAiLab er under løpende utvikling med nye modellstørrelser.
- Gemma 4 27B (Apache 2.0) — relevant for norsk med flerspråklig trening, kan kjøres lokalt og kommersiellt.
Eksisterende norske modeller
Borealis (NbAiLab)
Nasjonalbiblioteket (NbAiLab) utvikler Borealis som en serie
åpne språkmodeller for norsk og samisk. Modellene bygger videre på Gemma-familien,
lanseres i flere størrelser med åpen lisens, og kan fintrenes og driftes på
egen infrastruktur.
- Støtter bokmål, nynorsk og samiske språk
- Åpen lisens — egnet for forskning og produksjon
- Basert på Gemma-arkitekturen fra Google
- Kan fintrenes på domenespesifikke norske data
Utforsk Borealis og NbAiLab-modeller på Hugging Face →
NB-Llama-3.2 (NbAiLab)
Nye Llama 3.2-baserte modeller i 1B og 3B-størrelse, lansert april 2026.
Optimalisert spesifikt for norsk tekst med bred nordisk språkdekning.
- 1B-varianten kjører på CPU og enkle edge-enheter
- 3B-varianten gir godt kompromiss for chatbot og klassifisering
- Sterk flerspråklig støtte på nordiske språk
- Bygget på Meta Llama 3.2-arkitekturen
Last ned fra NbAiLab på Hugging Face →
NorMistral (NORA.LLM)
NorMistral er en serie norsk-tilpassede modeller i
NORA.LLM-initiativet. Finnes i 7B-warm og 11B-varianter.
NorMistral-11B-long har utvidet kontekstvindu for lengre dokumenter.
- NorMistral-7B-warm: praktisk størrelse for produksjon og eksperimentering
- NorMistral-11B: sterkere kapasitet med utvidet kontekst
- Kontinuerlig trent på store norske tekstkorpus
- Åpne vekter via Hugging Face
NORA.LLM-modeller på Hugging Face →
NorwAI (NTNU)
NorwAI er et modellspor fra NTNU, tilgjengelig i
Llama 2- og Mistral-arkitekturer. 7B og 45B-varianter er i
produksjonsdrift for forskning og nordisk bedriftsbruk.
- 7B: god balanse for egenhosting på standard server-GPU
- 45B: høyere kapasitet for krevende norske oppgaver
- Rettet mot akademia og nordiske industrimiljøer
- Åpent tilgjengelig for forskning
NorwAI på Hugging Face →
NorBLOOM og NorGPT
Tidligere norske modellspor som la grunnlaget for dagens initiativ.
NorBLOOM er en norsk tilpasning av BLOOM-arkitekturen.
NorGPT-3 var en tidlig GPT-3-basert norsk modell.
- Historisk viktige for å bygge norsk treningsdata-infrastruktur
- Fortsatt tilgjengelige for forskning og sammenligning
- Grunnlag for nyere og mer kapable modeller
Se alle NORA.LLM-modeller →
Scandi-modeller og nordisk samarbeid
Norsk KI-utvikling skjer ikke i isolasjon. Skandinaviske
samarbeidsmodeller som ScandEval-benchmarks og
nordiske tekstkorpus styrker hele regionen.
- Delte evalueringsrammeverk for nordiske språk
- Felles datasett og korpus på tvers av landegrenser
- Norsk deltagelse i europeiske KI-initiativ (HPLT, OPUS)
Hva er på vei
Borealis neste generasjon
NbAiLab arbeider med nye og større Borealis-varianter. Fokusområder
inkluderer multimodal støtte, lengre kontekstvindu og bedre dekning
av norske dialekter og samiske språk.
- Større modellstørrelser (13B+) under utvikling
- Potensielt multimodal støtte for norsk tekst og bilde
- Utvidet samisk språkdekning
Fintrening og domenespesialisering
Det norske fagmiljøet jobber med fintrente varianter for helse,
jus og offentlig forvaltning — der fagspråk og nøyaktighet er
kritisk.
- Norsk medisinsk NLP (Helse Sør-Øst og NTNU)
- Juridisk norsk fra lovdata og domstolssystemet
- Offentlig forvaltningsspråk (NAV, Skatteetaten)
Infrastruktur og compute
Tilgang på norsk og nordisk beregningsinfrastruktur er en
forutsetning for å trene og drifte konkurransedyktige modeller
i Europa.
- LUMI-supercomputeren (Finland) brukes av norske forskningsmiljøer
- Sigma2/NRIS gir norske akademikere tilgang til GPU-ressurser
- Europeisk EuroHPC-initiativ styrker nordisk kapasitet
Digital suverenitet som drivkraft
Offentlig sektor og regulerte bransjer etterspør modeller som kan
driftes innenfor norsk/europeisk jurisdiksjon. Dette driver
investeringer i norske og nordiske modellspor fremover.
- GDPR og personvernkrav favoriserer lokal drift
- Offentlige anskaffelsesregler presser mot åpne modeller
- Helsesektoren trenger suverene løsninger for pasientdata
Hvorfor små modeller er viktige
-
De presterer ofte svært godt på avgrensede språkoppgaver med
skreddersydde data.
-
De gir bedre kontroll over dataflyt, jurisdiksjon og personvernkrav.
-
De har lavere kostnad, lavere latens og kan kjøre på enklere
maskinvare.
-
De fungerer godt som komponenter i større KI-systemer sammen med
større modeller.
Strukturerte språkoppgaver
Små modeller er godt egnet for klassifisering, NER for norske navn,
sentimentanalyse, oppsummering og uttrekk av nøkkelinformasjon.
De er også nyttige for oversettelse mellom bokmål og nynorsk, og på
sikt mellom norske og samiske språkressurser.
Domenespesifikke fagsystemer
Fintrente modeller kan bli svært presise innen jus, helse, offentlig
forvaltning, finans og teknisk dokumentasjon.
Når språkmodellen trenes på relevant fagspråk, øker treffsikkerhet
og nytte i daglige arbeidsprosesser.
Digital suverenitet og personvern
Lokal drift gjør det mulig å behandle sensitive data uten å sende
informasjon til utenlandske skytjenester.
Dette er særlig relevant for helsesektor, rettsvesen, forsvar,
offentlig sektor og kritisk infrastruktur.
Kostnad og volum
Små modeller har lavere driftskostnad og responstid, noe som gjør
dem egnet for høyvolumoppgaver som tagging, metadata-generering og
batch-prosessering av store tekstsamlinger.
De passer også godt i chatboter, kundeservice og produkter der
eksterne API-kall blir for dyrt eller for tregt.
Rolle i større KI-arkitektur
RAG-pipelines
Spørsmålsomskriving, reranking og svarvalidering på norsk før
endelig respons sendes til brukeren.
Agentflyt
Ruting av forespørsler, verktøyvalg og enkel resonnering i
flertrinns systemer med krav om rask respons.
Kvalitet på norsk
Kontroll av språkføring, klart språk og målform for bokmål og
nynorsk i generert tekst.
Kulturarv, forskning og utdanning
-
Forbedret søk og gjenfinning i digitaliserte samlinger hos
kulturinstitusjoner.
-
OCR-etterbehandling, transkribering og automatisk metadata for store
historiske tekstkorpus.
-
Åpne modeller gir forskere og studenter mulighet til å
eksperimentere, inspisere og reprodusere resultater.
-
Språkforskning styrkes gjennom tilgang til modeller for dialekter,
språkstruktur og språkutvikling over tid.
Edge-distribusjon og bærekraft
De minste modellvariantene kan kjøres lokalt på bærbare maskiner,
arbeidsstasjoner og enkelte mobile enheter. Dette gjør løsningene mer
robuste i felt, ved ustabil nettilgang eller i isolerte miljøer.
Samtidig gir små modeller betydelig lavere energiforbruk per
forespørsel enn svært store modeller, og kan derfor være et mer
bærekraftig valg når oppgaven ikke krever en generell frontier-modell.
Oppsummering
Borealis og andre små, spesialiserte norske språkmodeller er ikke en
erstatning for alle store modeller. De fyller en komplementær rolle:
skreddersydd språkstøtte, lokal kontroll, lavere kostnad og raskere
drift i mange praktiske anvendelser.