Vacancy

Nasjonalbiblioteket

KI-utvikler/Språkteknolog – Seksjon for språkmodeller

Bibliotek

Vil du jobbe med å utvikle norske språkmodeller til å forstå norsk språk og kultur? Er du interessert i maskinlæring, kunstig intelligens og store språkmodeller? Er du opptatt av at maskinene skal snakke norsk, forstå norske dialekter og kjenne til norske forhold? Da er dette noe for deg.

De siste tjue årene har Nasjonalbiblioteket etablert en av verdens største samlinger av digital kulturarv, inkludert digital tekst. I 2024 lanserte vi NB-Whisper, den til nå beste modellen for talegjenkjenning på norsk. Vi gjennomførte også et spennende prosjekt med trening og evaluering av en rekke store generative tekstmodeller basert på digital tekst fra samlingen vår.

Nasjonalbiblioteket har fra og med 2025 fått i oppdrag av regjeringen å trene og tilgjengeliggjøre norske og samiske språkmodeller for bruk i offentlig og privat sektor. For å få til dette skal vi videreutvikle AI-laben vår til en egen seksjon for språkmodeller. Vil du hjelpe oss å styrke et av Norges fremste miljøer på utvikling av språkmodeller og KI i Nasjonalbiblioteket?

KI-utvikler/Språkteknolog – Seksjon for språkmodeller


Nasjonalbiblioteket lyser nå ut én - 2 faste stillinger og inntil tre 2-årige engasjementer som KI-utvikler/Språkteknolog. Vi trenger deg som vil være med å tilrettelegge og videreutvikle vår digitale samling til utvikling av språkmodeller for norsk og samisk.

Vi har behov for deg med kompetanse innen prosessering av store mengder tekst- eller taledata, eller som har erfaring med trening og evaluering av språkmodeller. Vi er interessert i hele syklusen for utvikling av språkmodeller: dataklargjøring og -utvalg, pre-trening, finjustering og tilpasning, resonnering og evaluering.

Nasjonalbiblioteket har et tett samarbeid med Sigma2, som sørger for nødvendig regnekraft til arbeidet vårt. Nasjonalbiblioteket er også en av hovedpartnerne i en KI-sentersøknad for språkmodeller til Forskningsrådet.

Kvalifikasjoner:

Vi ser etter en med utdanning tilsvarende minst en mastergrad i data/informatikk, fortrinnsvis med fordypning i språkteknologi eller maskinlæring, eller tilsvarende arbeidserfaring med relevant utdanningsbakgrunn, f.eks. lingvister/digitale humanister som har begitt seg i retning NLP. Både nyutdannede og erfarne utviklere er velkomne hos oss! Vi legger vekt på samarbeid, kompetanseutvikling og kunnskapsdeling.

Du må være lærevillig og ha interesse, forståelse og kunnskap om flere av følgende områder:

  • Utvikling, evaluering og bruk av maskinlæringsmodeller
  • Utvikling av språkteknologi og datahåndtering i f.eks. Python
  • Kubernetes, Docker, Git, Slurm eller Spark

    Det er en fordel om du behersker norsk som arbeidsspråk, både muntlig og skriftlig, men dette er ikke et krav. Vi har også behov for utviklere med kunnskap om samiske språk.
    Erfaring fra tilsvarende arbeid er ønskelig.
 

Personlige egenskaper:

  • Strukturert og nøyaktig
  • Gode samarbeidsevner
  • Kunne kommunisere klart og tydelig om språkteknologiske spørsmål
  • Evne til å arbeide selvstendig og effektivt
  • Personlig egnethet blir vektlagt.

Vi tilbyr:

 

Antall stillinger: 1-2 faste stillinger og inntil 3 midlertidige

  • Fast eller midlertidig stilling i stillingskode 1087 (overingeniør), 1181 (senioringeniør) eller 1109 (forsker II). Lønnes etter statens lønnsregulativ i lønnsspennet 650.000 – 800.000 avhengig av kvalifikasjoner, kompetanse og erfaring. For spesielt kvalifiserte søkere kan høyere lønn vurderes.
  • Medlemskap i Statens Pensjonskasse.
  • Nasjonalbiblioteket er en IA-bedrift.

Arbeidssted
Den faste stillingen har arbeidssted på Mo i Rana. De midlertidige stillingene har arbeidssted på Mo i Rana eller Oslo, eller etter avtale.