Hva kjennetegner Big data?

Big data eller det vi på norsk kaller «stordata» er midt i kjernen av Sannsyns virksomhet.

Foto: Jeswin Thomas. Bildet er hentet fra Pexels.com.

Big data har ikke i seg selv noen verdi, men i kombinasjon med ulike former for kunstig intelligens og data science er det mulig å skape store konkurransefortrinn, for eksempel i form av automatisering, markedsinnsikt eller kvalitetsforbedringer.

Hvor mye data som nå produseres i verden, er selvsagt krevende å beregne. IDC Global DataSphere har likevel forsøkt seg og beregnet at i 2025 vil vi ha 175 zettebyte med data i verden. Én zettabyte tilsvarer tusen milliarder gigabyte.

Definisjon av «Big data»

Når vi snakker om «Big data», mener vi egentlig datasett som er så komplekse eller innholdsrike at de er vanskelige å analysere med vanlige dataprosesseringsverktøy. Noen mer eksakt definisjon blir ofte vanskelig; da datateknologien blir stadig kraftigere er det som i dag oppfattes som store datamengder, i morgen å anse som små og svært håndterlige datamengder.

Med stadig kraftigere datateknologi og raskt økende datamengder, er det ofte mer hensiktsmessig å se på egenskapene til dataene:

  • Volum: Dataene må ha et så stort volum som igjen setter krav til både behandling, lagring, analyse og overføring.
  • Velositet: Dataene vokser ofte raskt og registreres i sanntid og det krever ofte at man hurtig kan analysere data-mengden.
  • Variasjon: Dataene kommer ofte fra mange ulike kilder, og er ofte en kombinasjon av strukturerte, semistrukturerte og ustrukturerte data.
  • Troverdighet: Med dataens makt og viktighet er det sentralt å ha kontroll på dataens pålitelighet og nøyaktighet.
  • Verdi: Når vi snakker om big data, er det ofte data som har en personlig, økonomisk, ideell eller samfunnsmessig verdi.

Noen av våre datadrevne kunder