Oliver er en junior-programvareutvikler og teamet hans jobber med å samle inn data fra forskjellige applikasjoner og sensorer. Oliver jobber også med å lage enkle relasjoner for å kartlegge datalivssyklusen og implementere relasjoner for ressurser i selskapet sånn at andre kan bruke denne informasjonen senere.
Det blir ikke utført mye vasking av data siden det er en vanskelig oppgave. Så denne dataen er ikke så veldig god for å lage intelligente applikasjoner som opererer i sanntid.
Laura er en junior-dataingenør som har spesialisert seg innenfor transformering av data til verdiful innsikt. Hun og hennes team jobber med å hente data fra forskjellige applikasjoner og sensorer. Men hennes team hjelper også Olivers team med å renske og preparere data. De bruker DataHub som dataplattformen for å dele og synkronisere data i mellom seg.
Laura har også utviklet en løsning som hjelper de med å bygge relasjoner mellom data delvis automatisk. Dataen de lager har mange flere dimensjoner og er vanskelig å forstå uten intelligente dataekstratorer.
Sophia har lang erfaring med å jobbe med data. Hun produserer ny data, ut i fra data hun henter fra andre. Hun leser også fra eksterne datakilder, som værdata og hun oppretter nye data features. Data blir produsert i sanntid og preparert på best mulig måte for data-scientists. Sophia kommuniserer med Laura, så Laura vet hva Sophia trenger og Sophia kommuniserer med Emma, så Sophia vet hva Emma trenger og hva Emma jobber med.
Siden selskapet Sophia jobber for har store mengder data, så skulle egentlig teamet deres vært større. Men DataHub avlaster de og hjelper med å håndtere kompleksisteten med sanntidsdata. De gjør at de kan bruke mer tid på å jobbe med dataen og bruke mindre tid på driftsoperasjonene.
Emma har erfaring med maskinlæring og dyp-læring. Hennes team består av flere dataforskere med bakgrunn innenfor statistikk, sannsynlighetsregning, programmering og dataprosessering. Med alle disse ferdighetene kombinert sammen så kan de hente ut verdiful innsikt og kunnskap fra data.
Datamodellering av en av de viktigste oppgavene til Emma. Der hun tar i bruk fra titalls til milliardvis av forskjellige dataparametere og putter de i samme modell. Hun har verktøy som kan automatisk bygge mange flere data features som kan brukes til å optimalisere modellene.
DataHub hjelper Emma med enkel tilgang til dataen hun trenger i sanntid. Siden dataen har gått igjennom flere steg for kvalitetssikring så bruker hun mindre tid på å vaske dataen og mer tid på å optimalisere modellen.
Helen har god domenekunnskap om hvordan forretningen fungerer. Hun er ekspert i regneark og datavisualisering og lager en daglig rapport av dataene som Oliver har lagt inn i DataHub. Noe av dataen hun bruker blir klassifisert som overskridelse av grenseverdi. Denne dataen skriver hun tilbake til DataHub som andre kan bruke.
Edward jobber med å kartlegge risiko i organisasjonen. Modellen han har laget bruker informasjonen som finnes i en kunnskapsgraf og er avhengig av data som endrer seg i sanntid. Dette er fordi grenseverdier korrelerer med tid.
Hendelsene som han oppdager blir klassfisert og sent tilbake til DataHub som andre kan benytte seg av. Tom abonnerer på data som kommer fra Edward.
Tom er den som leder selskapet og viser vei. Med mengen informasjon så er det vanskelig å ta de beste beslutningene. Men siden all data er tilgjengelig i DataHub, og livsløpet til dataen er kartlagt sammen med tilsvarende data så kan Tom ta gode beslutninger. Ved å se på dataene, så får han innsikt i predikert fremtid. Og han vet hvem han kan gå og spør direkte.
Se for deg at DataHub er en sentralisert oppbevaringssted for data som tilrettelegger at organisasjoner kan lagre, styre og analysere rå og ustrukturert data. Datalivsyklusen blir også lagret, så du alltid har kontroll. Strømming av data er også tilrettelagt for muligheten til å lage sanntids dataapplikasjoner. Det betyr at de som konsumerer data, ikke trenger å spør etter ny data, men får det levert rett til de på noen få millisekund.
Med DataHub så bygger du ned barrierene til datasiloene og frigjør data til hele organisasjonen. Mindre tid blir brukt på data håndtering og operasjoner og dataingeniørene får brukt mer tid på å hente ut verdifull innsikt og kunnskap fra dataen din.