Data er aldri objektive. La også erfaringer og intuisjon få rå litt innimellom
Blind tro på at data er en feilfri gjenspeiling av virkeligheten, lurer mange virksomheter til å treffe beslutninger på sviktende grunnlag.
Mange norske virksomheter ønsker å bli datadrevne. Altså at avgjørelser de treffer, om alt fra produktutvikling til drift og vedlikehold, primært skal være basert på innsamlede data.
Men nå har en Cambridge-professor publisert en vitenskapelig artikkel som viser at data aldri er objektive.
Med dette pluss min egen forskning som bakteppe, har jeg et råd til alle som har ambisjoner om å bli datadrevne: La også erfaringer og intuisjon få rå litt innimellom.
Alt fra sensordata til spørreundersøkelser
Data er så mangt. Informasjon fra sensorer som måler CO2-nivået i møterom, for eksempel. Eller svar fra en spørreundersøkelse.
Mange bedrifter treffer viktige beslutninger basert på slike data ut fra en antakelse om at opplysningene er en nøyaktig gjenspeiling av virkeligheten. På din arbeidsplass har kanskje en diskusjon om oppgradering av ventilasjonsanlegget blitt avgjort ut fra hva sensormålinger viser.
Desto mer tankevekkende er budskapet fra Matthew Jones, professor ved Judge Business School ved University of Cambridge.
Tre begrensninger ved data
Jones påviser at alle datasett har tre begrensninger og at dette gjør det uklokt å stole rått på data alene.
- Det går en grense for hvilke data som lar seg samle inn. Ingen teknologi kan måle alt. Også jus og personvern kan gi tilsvarende begrensninger.
- Pragmatiske hensyn, som økonomi, gjør det nødvendig å velge innsamlingsmåter som fanger data av litt lavere kvalitet enn det som ville vært ideelt.
- Det er vanskelig å vite om de dataene du har bestilt, rent faktisk ble samlet inn slik du ønsket og trodde.
Ifølge ferske funn vi i Sintef har gjort, er det mulig å redusere den tredje av disse feilkildene vesentlig. Dette gjør professor Jones’ dystre bilde litt lysere.
- Les også: – Vaktmestrene sitter på en gullgruve
Menneskelige og tekniske årsaker
Først litt mer om hva Jones sier om feilkilde nummer tre: Ifølge professoren er det flere grunner til at du ikke uten videre kan stole på at de dataene som faktisk samles inn er identiske med dem du bestilte.
For det første: menneskelige årsaker. De som lager en spørreundersøkelse, kjenner kanskje ikke bruksområdene de innsamlede dataene skal ha. Dermed kan de stille gale eller upresise spørsmål.
For det andre: tekniske årsaker. Kanskje en sensor måler unøyaktig.
Også kombinasjoner av menneskelige og tekniske feil kan forekomme. Som at installatøren av sensoren ikke visste hvordan den skulle installeres for at målingene skulle bli nøyaktige nok.
Men nettopp slike misforståelser lar seg forebygge. En fersk studie vi har gjort av hverdagen til vaktmestre i tre norske eiendomsselskap viser oss hvordan.
Vaktmesterfunn viser vei
I studien så vi at kommunikasjon mellom brukerne av måleresultater og de som samler inn resultatene, er gull verdt.
Når vaktmesterne fikk vite hvem som skulle ha resultatene, og hva avlesningene skulle brukes til, steg kvaliteten på dataene. Årsaken er trolig enkel: Om du kjenner de som skal bruke opplysningene du samler inn, kan du også spørre dem hvorfor innsamlingen gjøres.
Forståelsen dette ga vaktmesterne, gjorde dem i stand til å påse at sensorer i ventilasjonssystemer sto riktig plassert. Samtidig fikk de kunnskap nok til å luke ut mulige feilkilder ved målingene.
Usynlige datainnsamlere
Problemet har vært at de som samler inn dataene ofte har vært usynlige for brukerne av opplysningene.
Den ansvarlige VVS-ingeniøren har ikke lagt merke til vaktmesteren som ser innom måleutstyret i ventilasjonsanlegget. Og salgssjefen som planlegger en ny kampanje, har ikke snakket med dem som utformet spørreundersøkelsen kampanjen baserer seg på.
Vi ser “vaktmesterfunnene” våre som så viktige at vi nå, med støtte fra Forskningsrådet, har startet en tilsvarende studie blant it-utviklere hos it-konsulentselskapet Knowit, billettløsningsselskapet Entur, Nav og Kartverket.
Ser ut til å gjelde også it-utviklere
Hypotesen vår, som så langt ser ut til å stemme, er at også programvareprodukter blir bedre når de som utvikler programmene får sjansen til å snakke med de som framskaffer underlagsmaterialet.
Ifølge en stortingsmelding fra i fjor skapte dataøkonomien (utnyttelse av tingenes internett og kunstig intelligens) verdier for 150 milliarder kroner i Norge i 2020.
Meldingen beskriver hvordan det offentlige skal stimulere norsk næringsliv til å bli datadrevet. Skal vi nå dette målet og skape større verdier fra data, må vi bruke data riktig. Stol ikke blindt på at de viser deg virkeligheten. Glem ikke at magefølelsen din utgjør en ekspertvurdering bygget på mange års erfaring.
Skal bedriften din lykkes, bør du kombinere magefølelse med en realistisk forståelse av data. Først da vil du få et bilde av verden som er virkelighetsnært nok til å utgjøre et trygt beslutningsunderlag.
- Les også: Industri 5.0 – menneskets revansje?
Forskningen
Hvem: Tor Sporsem, Sintef, Morten Hatling, Sintef og Marius Mikalsen, Sintef
Hva: Invisible Data Curation Practices: A Case Study from Facility Management
Hvor: No. 2 (2021): NOKOBIT Norsk konferanse for organisasjoners bruk av IT
Artikkelen sto første gang i Dagens Næringsliv 29. oktober 2022 og gjengis her med DNs tillatelse.