Hva er Data Science?
Data Science er et krysningsfelt mellom statistikk, programmering og områdeekspertise, hvor disse brukes i kombinasjon for å løse mange ulike komplekse problemstillinger. Det kan for eksempel være bruk av en maskinlæringsmodell for å predikere sykefravær, om en kunde kommer til å si opp et abonnement eller bruk av sensor data for å predikere om en maskin kommer til å trenge vedlikehold i nærmeste framtid.
Hvor lite skal til for å komme i gang?
I dag finnes det mange ferdige ML-modeller (maskinlæringsmodeller) som er trent på store mengder med data. Mange av disse er tilgjengelig gjennom Azure, skyplattformen til Microsoft, som en ferdig tjeneste man kan sende data til og få tilbake prediksjoner. Det finnes ferdige modeller for å gjøre tekst til tale eller omvendt, tekstanalyse (sentiment analyse) for å se om en tekst er positivt eller negativt ladet, eller computer vision for å identifisere gjenstander i en videostrøm. For å ta disse tjenestene i bruk trenger du kun et abonnement på Azure, og avhengig av tjenesten, enten bare nettleser eller ferdige pakker i et programmeringsspråk. Utfordringen er ofte ikke tilgjengeligheten etter en maskinlæringsmodell, men problemer de kan løse, og det er det bedriften som vet best.
Hvilken kompetanse trengs?
Som tidligere nevnt så er områdeekspertise en nødvendighet for å gjøre god Data Science, her sitter som regel de som allerede jobber i bedriften med den beste kunnskapen. Hvis du eksempelvis ønsker å predikere sykefravær, vil det være naturlig å bruke områdeekspertisen til de som sitter i HR-avdelingen til bedriften for å fange opp særegenheter ved de forskjellige stillingene i bedriften. For å effektivt håndtere og analysere data, er det viktig å ha fagpersoner med riktige ferdigheter. Selv om ikke alle bedrifter har interne ressurser, kan man leie inn eksperter dersom man ønsker å undersøke om dette er en god løsning for seg selv. Siden disse tre rollene ikke trenger å være en og samme person, er det viktig at personene kommuniserer godt og har en arena hvor de kan foreslå ideer til hverandre, og kan teste ting fortløpende.
Etter hvert som deltakerne ser hva som finnes av data og erfarer hva som er mulig, vil de antagelig komme på mange små og store problemstillinger som lar seg løse ved hjelp av Data Science. Det er ikke alltid behov for å sette opp en løsning helt fra bunnen av hvis du vil se om noe er liv laga. Har du en Business Intelligence løsning er det ikke mye jobb å sende dataene til en ferdigtrent modell laget av en tredjepart. Denne kompetansen må ikke eksistere i et vakuum, det må være støtte i organisasjonen for å nyttiggjøre seg løsningene som kommer ut av Data Science satsingen til bedriften.
Hvilke forutsetninger må være møtt med tanke på datakvalitet og kultur?
Typen kultur som passer best med Data Science er en datadreven kultur, som er når du tar beslutninger basert på ferske, faktiske tall og analyser, og ikke driver med synsing basert på magefølelse. I en slik kultur vil Data Science kunne gi god verdi gjennom avanserte analyser enn det som ofte er vanlig i Business Intelligence, fordi beslutningstagere får mer nøyaktig og presist bilde av situasjonen. Et eksempel på dette er bruk av maskinlæring for å automatisk klassifisere kundetyper basert på all tilgjengelig informasjon man har om kunden, og dermed kan finne nye typer kunder.
God data er helt grunnleggende for å få en god prediksjon, du kan ikke skape gull ut av intet, og AI- eller ML-modeller er kun så god som dataene den har tilgjengelig. Som oftest vil du være godt på vei hvis dere har automatiserte rapporter som sammenstiller data fra flere kildesystem, også kjent som data estate eller data platform. Videre må dere tilgjengeliggjøre dataene til ansatte i bedriften, helst i team på tvers av fagområder og med tilgang til personer med kompetanse innen Data Science. Noen vil kanskje tenke at GDPR og personvern vil komme i veien for deling av data og med god grunn. En løsning på dette er å aggregere data og gjerne bruke Differential privacy, som konverterer på en slik måte at du ikke kan identifisere individ. Så selv om at dataen kan gjøres tilgjengelig, må du fortsatt vite hva dere skal bruke dataen til.
Har du spørsmål til Data Science?
Våre erfarne BI og Analytics konsulenter er her for å hjelpe deg med å få svar på alle dine spørsmål om Data Science. Enten du trenger bistand til å løse en kompleks problemstilling eller ønsker å forbedre din forståelse av området, våre konsulenter har den kunnskapen og erfaringen som kreves for å hjelpe deg videre.
Det er bare å ta kontakt i skjemaet under så finner vi en tid som passer deg.
Forfatter