språk-02-til-Gemini-NY-bredt
Om vi mennesker hører ordet "batteri", forstår vi ut fra sammenhengen om det gjelder et energilagringssystem eller en artillerienhet. Det gjør ikke datasystemer. Nå får de et felles språk, basert på ord som er så veldefinerte at de ikke kan misforstås. Illustrasjon: Knut Gangåssæter/SINTEF

Filosofer og teknologer gir datamaskinene felles språk. Det kan knekke uløste gåter

Språklig logikk med utspring i oldtidens filosofi hjelper oss nå i jakten på grønne materialer for framtida.

  • Hvordan velge materialer som får klær, møbler og sportsutstyr til å vare lenger?

  • Hvordan må råstoffer bearbeides for at det skal bli lett å gjenvinne “byggeklossene” i emballasje og hvitevarer?

  • Og hvilke miljøvennlige forbindelser kan gi batteriet i den neste elbilen din økt rekkevidde?

Nå skal det bli enklere å få svar på slike og andre spørsmål som avgjør om vi mennesker vil lykkes med den grønne omstillingen.

Enklere fordi en gruppe forskere i Europa, inklusive oss i SINTEF, nå lager et felles språk for vitenskapens datasystemer.

Det vil si et språk som gjør slike system i stand til å kommunisere uten menneskers tid- og kostnadskrevende involvering. Nærmere bestemt et definisjonssystem som har sine røtter i klassisk gresk filosofi og nå utvikles gjennom et nært samarbeid mellom filosofer av i dag og oss naturvitere.

Farvel til prosess med feilkilder

Bakteppet er at datamaskiner i dag gjør “nesten alt” innen forskning og industri. Resultater og dokumentasjon er derfor stort sett digitale, mens det som regel er mennesker som tolker slike data. 

Ett alternativ har vært å koble systemer sammen to og to ved å skreddersy “språkkurs”… En stor jobb. Litt som å gjøre nordmenn og finner i stand til å samarbeide ved å lære nordmenn finsk eller finnene norsk.

Hvis informasjon fra ett datasystem skal brukes videre av et annet system, må som oftest en manuell innmating til. En ineffektiv prosess med mange feilkilder. Eksempelvis fikk NAV for noen år siden erfare at dette ga lang saksbehandling.

Ett alternativ har vært å koble systemer sammen to og to ved å skreddersy nye “språkkurs” hver gang et program skal utveksle data, alt etter hvem “samtalepartneren er”.

En stor jobb. Litt som å gjøre nordmenn og finner i stand til å samarbeide ved å lære nordmenn finsk eller finnene norsk. Men om disse etterpå skal samarbeide med en tyrker eller portugiser, er de like langt.

Samme “alfabet og grammatikk”

Så hva om vi i stedet gir alle datasystem et språk med felles grunntrekk – i vår liknelse samme alfabet og felles grunnleggende grammatikkregler? Det er faktisk nok til å få alle system til å kommunisere effektivt.

Nettopp et slikt språk utvikler vi i prosjektene våre, som ledd i EUs rammeprogram for forskning.

For snart 950 år siden brukte filosofen Anselm av Canterbury ontologidisiplinen til å bevise at Gud finnes. Like høyt har ikke vi lagt lista.

Behovet for fellesspråket er nært knyttet til den økende bruken av maskinlæring – en av disiplinene innen vekstområdet kunstig intelligens.

(Artikkelen fortsetter under illustrasjonen.)

Illustrasjon. Hvite "noder" med nettverksstreker mellom seg, ligger oppå ansiktene til gresk filosof og Albert Einstein

Lærdom fra klassisk filosofi om hvordan verden lar seg beskrive, kommer nå naturvitenskapen til gode – i form av et felles språk for datasystemer.
Skal seks system snakke med hverandre i dag (til v. i figuren), trengs 15 separate “oversettingsjobber” (strekene i figuren).
Om et system nummer syv påkobles, øker tallet til 21 jobber.
Ved i stedet å la systemene snakke sammen via et felles språk (blått symbol til h.), blir kommunikasjonen langt enklere.
Da trengs kun én oversetterjobb, som det nå utvikles gode verktøy for å forenkle ytterligere.
llustrasjon: Knut Gangåssæter/SINTEF

Beskriver, formidler og gjenbruker data

Målet vårt er et formelt språk som kan beskrive, formidle og gjenbruke data.

Formelt ved at informasjon fra ethvert fagfelt skal kunne forstås og uttrykkes av maskiner og algoritmer. Blant annet legges rett inn i en kunstig intelligens, noe som en dag kan åpne for design av “det perfekte produkt” og avdekking av uante sammenhenger.

Språk i den forstand at informasjonen kan forstås og uttrykkes også av mennesker.

De er ikke som oss

Skal datasystemer snakke sammen, må de bruke de samme ordene. Og disse må være så veldefinerte at de ikke lar seg misforstå.

Datasystemer er ikke intelligente på samme måte som deg.

Men datasystemer er ikke intelligente på samme måte som deg. Om du hører ordet “batteri”, forstår du ut fra sammenhengen om det gjelder energilagring eller en artillerienhet.

Skal et datasystem skjønne sammenhengen må den spesifiseres. Slike formelle spesifikasjoner kaller vi ontologier.

Plukker et univers fra hverandre…

Ontologi er opprinnelig en gammel filosofisk disiplin som handler om hva virkeligheten består av.

Eksempelvis: Finnes stoler egentlig? Eller er de en samling partikler med et spesielt forhold til hverandre i rom og tid som kun skaper et inntrykk av at det vi kaller en stol finnes?

Prosjektene våre går utenom denne filosofiske tilnærmingen og hviler i stedet på ontologienes definisjonsregler for å beskrive det vi erfarer.

… og setter det sammen igjen

Slår du opp “stol” i en ordliste, er svaret “møbel til å sitte på”. Slike forklaringer inngår også i “ordlista” vi lager. Men vi utvider definisjonene ved å bryte begrepene ned til en slags legoklosser i tillegg.

Vi redegjør for de antatt minste byggesteinene en “ting” består av, og beskriver hvordan “legoklossene” kan settes sammen til større gjenstander.

Vi redegjør for de antatt minste byggesteinene en “ting” består av, og beskriver hvordan “legoklossene” lar seg sette sammen til større gjenstander.

Dette gir oss definisjoner av oppbyggingen til stoff og gjenstander, av prosessene som kan endre disse og av formålet med formgivingen. Slik gjenoppbygger vi det universet vi først plukket fra hverandre.

Til hjelp for kunstig intelligens

På 1980-tallet begynte forskere innen kunstig intelligens (AI) å bruke ontologier – til å lage databaser av begrep og forholdet mellom dem. Ved hjelp av disse utledet AI-systemer ny kunnskap gjennom logisk resonering.

Ontologier ble senere brukt til å lage en semantisk web. En utvidelse av internett som gjorde at ikke bare mennesker, men også datamaskiner kan dra nytte av informasjonen.

Så sto biomedisinfaget for tur. Ontologier bidro til at kunnskap om det komplette menneskelige arvematerialet (genomet) oppklarte til da skjulte sammenhenger. Deriblant hvordan ulike proteiner fungerer. Dette ga raske framskritt i medisinsk forskning.

Ordliste for naturvitenskap

Men innen materialteknologi har innføring av ontologier gått trått – fordi fysikk og kjemi er så komplekse og vidtspennende fag.

Det er bakgrunnen for arbeidet vårt. Ambisiøse prosjekt der vi lager en logisk forankret ontologi for naturvitenskap: En “ordliste” som kombinerer perspektiver fra høyst ulike fag- og forskningsmiljøer i sin beskrivelse av emner. Den har fått navnet Elemental Multiperspective Material Ontology.

Grønne batterier

Utvikling av grønne batterier er ett felt der ontologien vår kan gjøre en forskjell.

Utvikling av grønne batterier er ett felt der ontologien vår kan gjøre en forskjell.

Til det trengs et språk som forklarer at batterier består av en anode, katode, elektrolytt og andre komponenter. Vi må også definere hva en anode er. Angi dens egenskaper, beskrive dem og hvordan anoden forholder seg til de andre komponentene.

Til dette vil vi bruke et eget språk for fagfeltet batteriutvikling, basert på det grunnleggende språket vi alt har laget.

Slik vil datasystemer for batteriutvikling kunne utnytte informasjon fra andre fagfelt raskt og rimelig. Eksempelvis relevante resultater fra eksperimenter med røntgendiffraksjon, en metode som gir opplysninger om elektronfordelingen i molekyler.

Fri for menneskelig involvering

Hele datautvekslingen vil da skje uten menneskers tid- og kostnadskrevende involvering.

For snart 950 år siden brukte filosofen Anselm av Canterbury ontologidisiplinen til å bevise at Gud finnes. Like høyt har ikke vi lagt lista. Men vi er ubeskjedne nok til å si at vi skal bidra til teknologiske fremskritt ved å bruke klassisk filosofi på nye måter.

Kronikken ble første gang publisert i Dagsavisen 26. november 2022 og gjengis her med Dagsavisens tillatelse.

SINTEF har bidratt til det nye “fellesspråket for datasystemer” som deltaker i disse forskningsprosjektene (mange av dem inngår i EUs rammeprogram for forskning):

MarketPlaceOntoTransBIG-MAPOntoCommonsOpenModelDome4.0VIPCOAT, SFI ManufacturingSFI PhysMet