h

Store datamengder kan hjelpe folk i jobb

STORDATA I NAV // Hvorfor lykkes noen med å få seg jobb og andre ikke? Hva er risikoen for å bli langtidssykmeldt? Store datamengder kan hjelpe oss med å finne svarene.


I et prosjektlokale i Oslo sitter avdelingsleder ved NAV Alna, Mette Simonsen Vollset, og studerer tall sammen med data scientist Robindra Prabhu. Prosjekt «Datadrevet oppfølging» vil prøve å finne ut hva det er som gjør at noen lykkes med å komme i jobb, mens andre blir gående på tiltak etter tiltak. Kobling av store datamengder skal forhåpentlig gi dem ny innsikt.

Vollset regner med at de vil få bekreftet en del av det de allerede tror, men hun forventer også noen aha-opplevelser.

– Jeg er veldig nysgjerrig på resultatene, sier hun.

DATADREVET: Mette Simonsen Vollset ved NAV Alna og Robindra Prabhu fra NAV IT vil bruke data til å forbedre hjelpen til NAV-brukere.

Store datamengder

Stordata er enkelt sagt en betegnelse på store mengder data. I praksis blir begrepet brukt om store datamengder fra flere kilder som man ved hjelp av matematiske analyser og statistikk kobler sammen for å finne sammenhenger og trender man ikke kjente til fra før av. Forskjellen nå og for få år tilbake, er at datakildene er mye større og verktøyene vesentlig bedre.

Stadig flere aktører bruker stordata, og dermed har avanserte analyseteknikker og visualiseringer blitt mer tilgjengelige. Det gir også NAV nye muligheter til å utforske sammenhenger i vår rikholdige «datakiste».

Før sommeren i fjor begynte NAV så smått å se på hvordan vi kan bruke stordata. Initiativet kom fra fagsiden, og utpå høsten ble det satt i gang et arbeid for å finne ut hvilke bruksområder som er relevante for NAV. Kan stordata for eksempel brukes til å forutsi hvilke nye arbeidsledige som klarer seg selv? I så fall kan vi kanskje slutte å bruke penger på tiltak på de som statistisk sett klarer seg uten hjelp fra NAV, og heller prioritere de som har høy sannsynlighet for å bli langtidsledige.

Etiske problemstillinger

Petter Dybing i Arbeids- og velferdsdirektoratet ledet arbeidsgruppen som kom fram til noen forslag som ble til NAVs «prøvekaniner» for bruk av stordata.

– Vi må trå varsomt fordi det er en rekke etiske problemstillinger ved bruk av stordata, sier Dybing. – Dagens personvernlovgivning gir oss bare anledning til å bruke data til et forhåndsbestemt formål, men noe av poenget med stordata er jo nettopp at man finner sammenhenger vi ikke kjenner til på forhånd.

En annen etisk problemstilling, er at det man finner ut, kan oppfattes som en stigmatisering av ulike grupper.

– Sett at det viser seg at sannsynligheten for å bli langtidssykmeldt er spesielt stor for kvinner mellom 50 og 55 år. Er det da greit å bruke den informasjonen som utgangspunkt neste gang NAV-kontoret møter på en sykmeldt kvinne i den alderen, spør Dybing.

Alle har dessuten rett til å bli behandlet individuelt i møte med NAV.

//

Vi må trå varsomt fordi det er en rekke etiske problemstillinger ved bruk av stordata

PETTER DYBING, ARBEIDS- OG VELFERDSDIREKTORATET

I startgropen

Eksemplene på bruk av stordata er mange, ikke minst innenfor kommersiell virksomhet. Alle de digitale sporene vi legger igjen etter oss, gir nyttig informasjon om både eksisterende og potensielle kunder eller borgere.

Offentlig sektor i Norge har så smått begynt å bruke stordata til å jobbe bedre og mer effektivt, forteller fagdirektør i Direktoratet for forvaltning og IKT (Difi), Ellen Strålberg:

– For eksempel kan Skatteetaten identifisere skatteytere som antas å bevisst unndra skatt, Tolletaten kan bruke digital etterretning og smart dataanalyse til mer treffsikker grensekontroll, og Vegvesenet kan bruke trafikkdata til bedre beslutningsgrunnlag for alle typer veiprosjekt, bedre trafikkavvikling og ikke minst bedre trafikksikkerhet.

Størst innflytelse på folks hverdag er det antakelig innenfor helse.

– Det finnes enorme mengder data som kan bidra til større treffsikkerhet både ved diagnostisering og behandling og dermed økt pasienttilfredshet. Flere sykehus er allerede i gang.

Likevel – Norge er helt i startgropen når det gjelder å utnytte mulighetene som ligger i stordata.

– Alle er enige om at potensialet for stordata er stort, men i det store og det hele er vi fortsatt i en utforskningsfase, sier Strålberg.

I utlandet er det mer brukt, også i offentlig virksomhet. California bruker stordata til å styre politiressurser, men det er flere etiske problemstillinger, spesielt med tanke på personovervåking og stigmatisering av grupper og individer. I mai 2018 kommer EUs personvernforordning, som også vil gjelde Norge. Forordningen vil beskrive hvordan personopplysninger kan brukes – og framfor alt ikke kan brukes.

Ett av kravene er at alle offentlige og mange private virksomheter må ha et personvernombud. Det fikk NAV da Anders Holt ble ansatt i fjor høst.

Les også: – Personvern handler ikke bare om jus og sikkerhet, sier NAVs personvernombud.

Inspirert av Newcastle

NAV Alnas prosjekt «Datadrevet oppfølging» startet høsten 2017 og finansieres dels fra eget budsjett og dels med penger de har fått fra Groruddalssatsingen. NAV IT bekoster IT-ressursene.

Mette Simonsen Vollset er prosjektleder og forteller at initiativet kom etter en studietur til Newcastle tidligere i år. Gjennom prosjektet «The data driven social worker» – «den datadrevne sosialarbeider», har de kommet ganske langt i å rasjonalisere velferdstjenestene sine.

– Vi fikk en liten smakebit på hvordan analytikere og sosialarbeidere jobber sammen for å se på langtidseffekter av tiltakene de har satt i gang der, forteller Vollset. – De har blant annet sett på foreldrene til barna de hadde i barnevernet og koblet sammen historikken deres og tiltakene de hadde satt i gang. På den måten kunne de lære mye om effekten av arbeidet sitt.

Strengt tatt er ikke dette et stordata-prosjekt, ettersom mengdene data er av det overkommelige slaget og de verken bruker kunstig intelligens eller digitale spor. Måten å bruke dataene og målet med prosjektet minner likevel mye om det mange vil forbinde med stordata.

//

NAV har ikke hatt en kultur for å bruke opplysninger om brukerne på denne måten

ROBINDRA PRABHU, NAV IT

Vil avdekke manglende ferdigheter

NAV Alna ønsker blant annet å avdekke om manglende grunnleggende ferdigheter er årsaken til at arbeidssøkerne deres blir gående ledig selv om de deltar på tiltak. NAV-kontoret på østsiden av Oslo har omkring 5 200 personer i arbeidsdyktig alder som ikke er i jobb. En stor del er innvandrere. Vollsets hypotese er at mange har mangelfull skolegang.

– Når de krysser av for at de har gått på grunnskole, så tenker vi at de har gått alle årene. Men de har kanskje bare gått fem, og det var kanskje tre dager i uken på en landsbyskole. Og hvis de ikke har grunnleggende ferdigheter i matematikk og lesing og skriving, er de sjanseløse når vi setter dem på tiltak som forutsetter fullført grunnskole.

Hypotesen er ikke ny. Vollset jobbet med den allerede i 2015, men nå får hun mulighet til å få den bekreftet eller avkreftet. Og kanskje dukker det opp andre ting hun ikke var klar over og som vil være viktige bidrag i arbeidet med å tilpasse tiltak til målgruppene deres.

Analyserer data om NAVs brukere

Sammen med Robindra Prabhu fra NAV IT skal hun analysere datamengder fra NAVs fagsystemer om NAV Alnas nåværende brukere. Parallelt jobber andre prosjektmedarbeidere med å analysere dataer helt tilbake fra Aetat og trygdeetaten.

– Vi kan følge «tjenestereiser» hos brukerne gjennom flere tiår, og det kan fortelle oss mye om hvordan NAV har jobbet, sier Prabhu.

Kanskje får de også anledning til å bruke kommunale datakilder. I så fall får de en fullstendig oversikt over hele brukergruppen og hvem som beveger seg mellom statlige og kommunale tjenester.

Prabhu er en såkalt data scientist, som betyr at han jobber med kunstig intelligens (AI) og maskinlæring. Det er rift om sånne som ham, og flere norske universiteter er nå i gang med å opprette masterstudier. Sørover i Europa, og spesielt i England, er det allerede en rekke muligheter til å studere data science.

Opprinnelig er Prabhu partikkelfysiker med bakgrunn fra Cern. Ønsket om å bidra til å forbedre folks hverdag førte ham til NAV IT for et halvt år siden.

Han sier at selv om dette prosjektet rent praktisk ville latt seg gjennomføre for noen år tilbake, tror han ikke tiden har vært moden før nå.

– NAV har ikke hatt en kultur for å bruke opplysninger om brukerne på denne måten. Nå er det blitt såpass vanlig å tenke seg nye måter å gjøre seg nytte av data på.

Vil helst ikke se dem igjen

Målet med NAV Alnas prosjekt er definert på forhånd:

– Det er å sørge for å gi arbeidsledige det riktige tiltaket på det riktige nivået med én gang, i stedet for at de deltar på tiltak etter tiltak, sier Vollset. – På lengre sikt er målet å aldri se dem igjen på NAV-kontoret fordi de har fått de ferdighetene som trengs for å få seg jobb og bli i den over tid. For det vi ofte ser, er at mange er tilbake på tiltak etter et kort opphold i arbeidslivet.

//

De variablene som er interessante, er de vi kan påvirke

METTE SIMONSEN VOLLSET, NAV ALNA

– Er det ikke en fare for stigmatisering av brukerne og forutinntatthet blant veilederne?

– Jeg er glad for at du spør om akkurat det, fordi: Til en viss grad er vi allerede forutinntatte, uten å ha analyser. Vi tror vi vet, men vi kan ikke dokumentere det. Og selv om vi kanskje vil se at mange personer fra ett bestemt land har lite skolegang, er ikke landbakgrunn interessant i seg selv. Vi ser etter egenskaper hos brukerne som arbeidslivet trenger, samtidig som vi får god innsikt i hva slags type hjelp de har fått – eller ikke fått – fra NAV. De variablene som er interessante, er de vi kan påvirke.

Vollset påpeker at det også er andre etiske sider:

– Siden vi også skal intervjue noen av brukerne våre, regner vi med at vi kommer til å få vite mye mer om hvor dårlig det er fatt med noen av dem, sier Vollset. – Det forplikter. Vi kan ikke bare avdekke problemer uten å ha ambisjoner om å gjøre noe med dem.

Stordatalab i NAV

NAVs bruk av stordata omfatter foreløpig bare egne datakilder og opplysninger fra Folkeregisteret.

– Verken andre offentlige kilder eller digitale spor blir brukt når vi for eksempel prøver å forutsi hvem som trenger oppfølging fra NAV og hvem som kommer til å klare seg på egenhånd, forteller leder for statistikkseksjonen i Arbeids- og velferdsdirektoratet, Ulf Andersen.

Han leder NAVs Stordatalab, som ble etablert som et forsøk i mars 2017. I oktober ble det besluttet at labben skulle plasseres under Kunnskapsavdelingen, som et kunnskapssenter for hele NAV. Alle fagavdelinger er representert.

LEDER STORDATALAB I NAV: Ulf Andersen

Andersen er den formelle lederen av Stordatalab, som i tillegg til generell kunnskap, formulering av regler for og beskrivelse av datakilder, skal spille inn forslag til bruksområder.

Og de kan vise seg å bli mange.

– Oppfølging av arbeidsledige er ett eksempel, sier Andersen. – Vi kan mer eller mindre forutsi hvem som kommer til å klare seg uten oppfølging fra NAV, basert på opplysninger om andre personer med tilsvarende bakgrunn. Sykefraværsoppfølging er et annet eksempel. Kanskje kan vi finne ut hva som kjennetegner personer som står i fare for å bli langtidssykmeldte. Andre eksempler på mulige bruksområder er feilutbetalinger og trygdesvindel.

Mange smarte hoder

For å få flest mulig innspill og ideer til bruksområder har NAV lagt ut store datamaterialer uten identifiserbare personopplysninger på data.norge.no, som er «datahotellet» til Difi.

//

Det er mange smarte hoder som kan bruke vårt datamateriale til noe nyttig

ULF ANDERSEN, ARBEIDS- OG VELFERDSDIREKTORATET

Vi er også en av partnerne i Big Insight, som ledes av Norsk Regnesentral og som med midler fra Forskningsrådet er det store forskningsdrevne innovasjonsprogrammet innenfor stordata. Og i oktober deltok vi på #hack4no, «Norges største lekegrind med åpne data».

– Det er mange smarte hoder som kan bruke vårt datamateriale til noe nyttig, og kanskje kan de hjelpe oss å finne nye bruksområder som bidrar til at både brukerne våre og NAV-veiledere kan bruke tiden sin mest mulig effektivt, sier Andersen.

Hvor mye vi kan finne ut, avhenger av datakildene og antall variable som legges inn, sier Andersen.

– Alder, arbeidserfaring og utdanning gjør at vi langt på vei kan forutsi om en person trenger hjelp fra NAV til å komme i jobb eller ikke. Sommeren 2018 vil det bli lansert en versjon med i alle fall disse tre variablene på den digitale tjenesten «Forenklet oppfølging» på nav.no.

Foreløpig kan vi ikke bruke stordata til mer enn å grovsortere brukere i to grupper: De som sannsynligvis klarer seg uten hjelp fra NAV og de som trenger personlig oppfølging. På lengre sikt kan man tenke seg at sorteringen blir mer finmasket, slik at man kan komme med konkrete forslag og tips til hver enkelt bruker.

Riktig tiltak med én gang

NAV Alna-prosjektet «Datadrevet oppfølging» er mer finmasket. For i tillegg til å analysere data om titusenvis av personer, skal de også gjøre kvalitative intervjuer av både brukere og NAV-veiledere.

– Noe av faren ved bare å bruke data man henter ut fra fagsystemer, er at opplysningene kan være farget av hvordan NAV alltid har jobbet og tenkt at virkeligheten ser ut. Data er registrert inn etter en systematikk bestemt av NAV, sier Prabhu. – I tillegg er det mye selvregistrering, og man kan bare registrere etter norske variable. Dermed vet vi ikke med sikkerhet om folk har svart på det vi mener å spørre om. Så fallgruvene er mange.

– Dessuten kan vi ikke være sikre på at NAV spør om de riktige tingene, kanskje går vi glipp av helt vesentlig informasjon, sier Vollset.

Nå er de i en fase med kvalitetssikring av dataene de bruker. Når prosjektet avsluttes til høsten, håper prosjektmedarbeiderne at funnene deres kan brukes til å utvikle verktøy som kan hjelpe NAV-kontorer med å finne riktig tiltak til hver enkelt arbeidssøker.

– Da vil vi kunne gi bedre hjelp enn vi gjør i dag, samtidig som vi slipper å prøve og feile med tiltak etter tiltak, sier Vollset, som tenker tilbake på tiden da NAV skulle starte med elektronisk dokumenthåndtering for noen år siden: – Da fikk vi utdelt buttons der det sto: «Gjør det riktig med én gang». Den burde vi ha når vi møter brukerne våre også. //

 


FacebookTwitterLinkedInEmail