FFI – Forsvarets forskningsinstitutt: Grafer kan øke gjenbrukbarheten av stordata

For å legge til rette for gode militære avgjørelser er det fordelaktig å kunne gjenbruke informasjon som allerede er samlet inn eller forberedt for andre formål.

Gjenbruk av stordata er fordelaktig for analytikere. Foto: Sindre Sørhus/Forsvaret

Se for deg følgende. Et analyseteam skal støtte en pågående militær operasjon i en bestemt region. Deres oppgave er blant annet å følge med på begivenheter i regionen som kan ha betydning for operasjonen.

For å gjøre dette må de ta i bruk alle tilgjengelige kilder for å skaffe en så god situasjonsforståelse som mulig. Underveis i operasjonen får de tilgang til en ny kilde med nyhetshendelser. Utfordringen blir å slå sammen sanntids nyhetsstrømmen med statisk bakgrunnskunnskap.

I en ny FFI-rapport brukte forskerne Jonas Halvorsen og Bjørn Jervell Hansen dette tenkte, men høyst reelle, scenariet på nyhetsanalyse i sanntid som utgangspunkt. Rapporten er et delresultat i prosjektet «Informasjonsintegrasjon for et moderne forsvar» der et av målene er å studere teknologier og teknikker for å håndtere store datamengder. Hensikten er å vurdere hvorvidt det er gjennomførbart å bygge en stordata infrastruktur med egenskaper som gjør det mulig å gjenbruke data kontrollert i en militær kontekst.

FFI-RAPPORT 2020

Exploring data reuse using a big data infrastructure

Jonas Halvorsen, Bjørn Jervell Hansen

Grafer er mulig løsning

Det er to hovedutfordringer knyttet til gjenbruk av stordata. For det første er det en teknisk utfordring å holde styr på format og datamodell slik at det er mulig å få lest og forstå innholdet. Videre er det en utfordring å ha verktøy som er i stand til å håndtere data som kommer raskt og kontinuerlig (strømmende data) uten å stoppe helt opp.

– Den viktigste lærdommen vi tok med oss var at det er realistisk å håndtere strømmende data i graf-form og at det virker å kunne øke gjenbrukbarheten av dataene fordi grafer er en intuitiv måte å forstå data på, forteller Hansen

Hva er stordata?

Begrepet stordata er på mange måter mer dekkende som en betegnelse for en samfunnsutvikling enn for en bestemt teknologi, og har så langt ikke fått noen entydig definisjon. Isteden karakteriseres stordata som regel ved hjelp av de såkalte tre V’ene VolumeVelocity og Variety: Stordata er data av forskjelligartet natur (Variety), som kommer i store mengder (Volume) og/eller har hyppig oppdateringsfrekvens (Velocity) og som et resultat av dette ikke lar seg effektivt håndtere eller bearbeide ved hjelp av tradisjonelle metoder.

I rapporten demonstrerer forskerne hvordan det er mulig å utnytte stordatateknologier (basert på åpen kildekode) fra sivil sektor i det militære domenet for å legge til rette for økt, kontrollert datagjenbruk.

– Dette støtter hypotesen om at dette kan gjennomføres, og rapporten kan være nyttig informasjonsgrunnlag når man vurderer forskjellige tilnærminger for å håndtere informasjonsforvaltning i en militær kontekst, sier Hansen.

Forsøket forsterket også forskernes antakelser om at det eksisterer mange godt fungerende software-komponenter som relativt enkelt kan settes sammen til et verktøy som gjør en bruker (f.eks. en analytiker) i stand til å dra nytte av strømmende data fra forskjellige kilder.

Økt fokus på gjenbruk

Å ta gode militære avgjørelser krever et høyt nivå av situasjonsbevissthet, noe som kan forbedres ved å ha mest mulig relevant informasjon tilgjengelig. I stadig større grad vil behovet for å kunne gjenbruke informasjon være nødvendig.

Forsvaret har de siste 15 årene endret strategi fra det tradisjonelle need-to-know-regimet over til en mer åpen responsibility-to-share-strategi. Dette skiftet innebærer et større ansvar for dataeiere å tenke på gjenbruk av data og å gjøre dem tilgjengelig for andre som kan ha bruk for dem. Dette er først og fremst en policy- og kultur-utfordring, men stiller også krav til data-verktøy:

– Det må finnes verktøy som er så enkle å bruke at de som har data de ønsker å dele enkelt kan gjøre det samtidig som det er sikkert nok med tanke på tilgangskontroll slik at de tør å dele dataene. På mottakersiden trengs det også verktøy som gjør brukere i stand til å finne dataene de er ute etter, forklarer Hansen.

Forskerne planlegger et siste teknisk eksperiment med sammensetting av kompoenter til et verktøy for strømmende data der målet er å studere automatisk deteksjon av hendelser for videre analyse i en overvåkings-/etterretningssituasjon. En avsluttende rapport som oppsummerer prosjektets funn om håndtering av strømmende data kommer til høsten.

De identifiserte noen software-komponenter som virker å være sentrale i sammensetting av stordata-verktøy, men antar allikevel at det i stor grad vil være slik at slike verktøy må komponeres ut fra den konkrete oppgave det skal støtte. Å sette sammen software-komponenter til et generisk stordata-verktøy virker lite realistisk.