Ledig stilling

Nasjonalbiblioteket

AI utviklere - Pretraining

Bibliotek

Seksjon for språkmodeller

Nasjonalbiblioteket annonserer nå to faste stillinger som AI-utviklere, lokalisert i Oslo eller Mo i Rana. Vi ser etter kandidater som ønsker å bidra i opplæringsfasen av utviklingen av språkmodeller for norsk og samisk språk, og har kompetanse innen opplæring, finjustering og post-training av språkmodeller.

Kvalifikasjoner:

Vi ser etter kandidater med utdanning tilsvarende minst en mastergrad i informatikk, helst med spesialisering i språkteknologi, maskinlæring, eller HPC, eller tilsvarende relevant arbeidserfaring.

  • Utvikling, evaluering og bruk av maskinlæringsmodeller
  • Språkteknologi og databehandling
  • Særlig god kompetanse om High Performance Computing (HPC)-plattformer kreves, spesielt erfaring med Olivia i Norge, LUMI i Finland og EuroHPC-nettverket
  • Kjennskap til fler-node-trening av store språkmodeller i stor skala, inkludert kjøringer over 256 GPU-er
  • Sterke ferdigheter i Python og god erfaring med Git/GitHub, Linux, Bash og SSH
  • Det kreves kunnskap om Hugging Face, Megatron-LM og overvåket finjusteringsrammeverk som LlamaFactory og Axolotl
  • Docker og Apptainer/Singularity kreves
  • Solid erfaring med å jobbe med Slurm og andre oppgave-orkestratorer kreves
  • Noe kunnskap om post-training kreves, inkludert minimum supervised fine-tuning (SFT)
  • Solid forståelse av transformerarkitekturer, relevant matematisk grunnlag og treningsdynamikk for LLM-er
  • Erfaring med å bygge eller anvende LLM-systemer, med god forståelse av deres kapabiliteter, begrensninger, risiko og praktiske bruksområder
  • Erfaring med å automatisere arbeidsflyter med LLM-agenter, gjerne med flertrinns verktøykalling
  • Erfaring fra lignende arbeid kreves og må dokumenteres

 

Ønskelige kvalifikasjoner:

  • Erfaring med kodeagenter eller agent-rammeverk som Claude Code, OpenCode, Codex CLI eller lignende
  • Erfaring med autoresearch eller beslektede systemer
  • Kjennskap til inferens- og serveringsrammeverk som vLLM, vLLM-Omni, llama.cpp og SGLang
  • Erfaring med RL- eller post-treningsmetoder, inkludert RLAIF
  • Kjennskap til CI/CD, GitHub Actions, LoRA, Unsloth, modellfletting eller MergeKit
  • Erfaring med å skrive ML-kjerner eller shaders i CUDA, Triton, Vulkan eller Metal
  • Erfaring med forsterkningslæringsmetoder for språkmodeller, inkludert DPO, REINFORCE og GRPO, er ønskelig
  • Deltakelse i open source prosjekter vil bli vektlagt

 

Sikkerhetskrav
Stillingen krever at du oppfyller virksomhetens krav til personellsikkerhet. Kravene for denne stillingen tilsvarer sikkerhetsklarering og autorisasjon på HEMMELIG nivå.

Personlige egenskaper:

  • Strukturert og presis
  • Gode samarbeidsevner
  • Evne til å kommunisere klart og tydelig om språkteknologiske problemstillinger
  • Evne til å jobbe selvstendig og effektivt Personlig egnethet vektlegges

Vi tilbyr:

  • To faste stillinger
  • Stillingskode 1087 (senioringeniør). Lønn etter statens lønnsregulativ i lønnsspennet 580 000–725 000, avhengig av kvalifikasjoner, kompetanse og erfaring. For særlig kvalifiserte søkere kan høyere lønn vurderes
  • Fleksitid og betalt overtid
  • Sommertid og betalt lunsjpause (7 timer, sommer og 7 t 45 min., vinter)
  • Medlemskap i Statens pensjonskasse Nasjonalbiblioteket er en IA-virksomhet