Ser norsk arbeidsliv i kortene med statistikk og maskinlæring
I Norge finnes det rundt 270 000 bedrifter. Hvert år skal Arbeidstilsynet velge ut 15 000 av dem for tilsyn. Forskerhjelp bidrar nå til å gjøre utvelgelsen så smart som mulig.
Dette er problemstillingen som forskere og teknologer har dykket ned i på oppdrag fra Direktoratet for arbeidstilsynet.
Arbeidstilsynet har 400 inspektører på lønningslista. Om disse skulle kontrollere alle landets virksomheter, ville de bli nødt til å inspisere og rapportere fra 675 bedrifter hver. Hvert år.
– Det er ikke ønske eller behov for å kontrollere alle bedriftene. Men å få på plass et risikobasert system som kan gi oss en pekepinn om hvor og hvilke virksomheter vi bør prioritere har vært et ønske, sier prosjektleder og seniorrådgiver i Arbeidstilsynet, Marius Søberg.
Derfor har direktoratet fått forskerhjelp fra SINTEF og bistand til teknologisk utvikling fra Inmeta Consulting og Microsoft i jobben med å utvikle det nye systemet. Målet er mer effektiv ressursbruk for tilsynsaktiviteten.
Finner risiko-kandidater
Resultatet fra utviklingsarbeidet har blitt et digitalt system som baserer seg på statistikk og maskinlæring og som med svært stor treffsikkerhet gir indikasjoner på hvilke bedrifter som er risikoutsatt. Med andre ord: hvilke bedrifter som har størst sannsynlighet for å ha forhold som kan gå på liv og helse løs. Det er ressurssparende for alle parter.
Utviklingsarbeidet startet med en pilotstudie i fjor. Målet var å utvikle et risikobasert system som fant kvalifiserte tilsyns-kandidater basert på det som finnes av tilgjengelig informasjon om virksomhetene i målgruppa: Altså norske bedrifter som har en ansatt eller mer. Prosjektgruppen besto av både forskere, it-folk og arbeidstilsynet selv.
Med erfaringsdata som grunnmur
Å lage et slikt system høres muligens enklere ut enn det er. Så for å finne ut hvilke kriterier som burde ligge til grunn for utvelgelsen, tok teamet fatt i datasettet de hadde om 40.000 bedrifter som allerede hadde hatt tilsyn.
Noen bedriftstyper er mer relevante enn andre. Gjennom å se på resultatene fra tidligere tilsyn ville vi finne ut hva som karakteriserte de vi hadde truffet godt på, forteller SINTEF-forsker Øyvind Dahl, som har deltatt i utviklingen og som til daglig forsker på sikkerhet.
Var det for eksempel registrerte avvik under tilsynet, og mer enn ett? Var det en politianmeldelse inne i bildet? Hadde bedriften fått et gebyr , eller hadde Arbeidstilsynet vedtatt stans i produksjonen som følge av fare for liv og helse?
En systematisk gjennomgang gjorde det mulig å dele bedriftene inn i to kategorier: En for høy og en for lav risiko.
– Vi jobbet lenge med å finne definisjonen for en høyrisikobedrift, vi var faktisk gjennom tjue ulike modeller før vi endte med noe som fungerte, forteller SINTEF-forskeren.
Deretter ble det bygget en statistisk modell som benytter en rekke ulike variabler som hva slags næring virksomheten tilhører, antall ansatte, resultater etter tidligere tilsyn, økonomi og antall registrerte ulykker, for å nevne noe. På fagspråket kalles dette logistisk regresjonsanalyse, som gir en risikoprosent fra en til hundre. Modellen er i dag i stand til å predikere sannsynligheten for at en bedrift har behov for tilsyn med ganske stor nøyaktighet – både for bedriftene som er i høy- og lavrisikogruppen.
– Det er jo ikke sånn at det aldri er behov for tilsyn bare fordi sannsynligheten for å finne avvik og bruke reaksjons- og pressmidler er lav. Vi vektlegger flere faktorer enn de som finnes i modellen i slike vurderinger, og er på ingen måte bare på utkikk etter å finne avvik, sier prosjektlederen.
Enkelt å tolke
For å gjøre resultatene lette å tolke for inspektørene er det lagt mye vekt på visualisering av dem.
Bedriftenes resultat ble delt inn i fire hovedgrupper: Lavest, lav, høy og høyest. Virksomhetene ble sortert i stigende rekkefølge etter sannsynlighetsverdiene fra regresjonsanalysen. Deretter ble de første 25 prosent av virksomhetene plassert i gruppen “lavest”, og så den 25 neste i gruppen “lav” osv.
Dette gjorde det mulig å bruke et slags kakediagram med fire felter – som i et kikkertsikte i visualiseringen.
– Når inspektørene planlegger en kontroll kan de altså få opp bedriftens risikoprofil som et enkelt kakediagram som gir en pekepinn om risikoklasse, forklarer Øyvind Dahl i SINTEF.
Tester (Anova, red adm.) har vist at systemet har stor treffsikkerhet: Modellen predikerer riktig i 80-90 prosent av tilfellene i gruppen med høyest risiko. I gruppen med bedrifter som er klassifisert med lavest risiko, predikerer modellen riktig i 75-80 prosent av tilfellene, ifølge SINTEFs beregninger.
Oppdateres hver natt
– Det var veldig viktig for oss at resultatet skulle bli en operativ løsning, at dette ikke ble et “skrivebordsprosjekt” som bare havnet i en skuff. I dag er systemet installert som en del av it-systemet til arbeidstilsynet, opplyser SINTEF-forsker Øyvind Dahl.
Løsningen tar også høyde for at det totale antallet og sammensetningen av norske bedrifter endrer seg over tid- og raskt.
– Systemet henter inn nye data fra Brønnøysundregistrene hver natt og ved hjelp av maskinlæring klassifiseres disse som høy eller lavrisiko og vurderes etter sannsynligheten for avvik. I tillegg trenes modellen månedlig for å fange opp ferske funn fra tilsynene. Systemet er altså på vakt både natt og dag, sier Marius Søberg i Arbeidstilsynet.
– Letter arbeidshverdagen
Harald Gran er tilsynsleder i Arbeidstilsynet, og jobber til daglig med å kvalitetssikre tilsyn som planlegges av inspektører som jobber i region Midt-Norge. Han har tro på at det nye verktøyet blir nyttig for inspektørene:
– Om man står med ti mulige bedrifter aktuelle for tilsyn vil det være nyttig å ha et slikt støtteverktøy. Det handler jo om å ta best mulig valg når vi ser etter bedrifter som kan ha det vi kaller avvik, sier Gran.
Han tror også at løsningen vil gjøre at Arbeidstilsynet blir tryggere på utvalgene som gjøres, og ikke minst vil det bidra til at valg tas på grunnlag av de samme kriteriene, uavhengig av hvem som foretar valget.
– Verktøyet vil også bidra til å gi mer systematikk i det store bildet, sier tilsynsleder Harald Gran.
Han presiserer at selv om indeksen kan bidra til å finne virksomheter hvor Arbeidstilsynet sannsynligvis vil finne brudd på regelverket, kan det være mange andre grunner til å gjennomføre tilsyn utover dette: Alvorlige hendelser, tips, objektivt sett risikofylt arbeid, eller andre viktige tema som Arbeidstilsynet ønsker å rette søkelyset på.
– Vi er ikke alltid bare på utkikk etter feil og mangler. Derfor vil vi aldri bare jobbe etter denne indeksen, sier Gran.