Big data har ikke i seg selv noen verdi, men i kombinasjon med ulike former for kunstig intelligens og data science er det mulig å skape store konkurransefortrinn, for eksempel i form av automatisering, markedsinnsikt eller kvalitetsforbedringer.
Hvor mye data som nå produseres i verden, er selvsagt krevende å beregne. IDC Global DataSphere har likevel forsøkt seg og beregnet at i 2025 vil vi ha 175 zettebyte med data i verden. Én zettabyte tilsvarer tusen milliarder gigabyte.
Definisjon av «Big data»
Når vi snakker om «Big data», mener vi egentlig datasett som er så komplekse eller innholdsrike at de er vanskelige å analysere med vanlige dataprosesseringsverktøy. Noen mer eksakt definisjon blir ofte vanskelig; da datateknologien blir stadig kraftigere er det som i dag oppfattes som store datamengder, i morgen å anse som små og svært håndterlige datamengder.
Med stadig kraftigere datateknologi og raskt økende datamengder, er det ofte mer hensiktsmessig å se på egenskapene til dataene:
- Volum: Dataene må ha et så stort volum som igjen setter krav til både behandling, lagring, analyse og overføring.
- Velositet: Dataene vokser ofte raskt og registreres i sanntid og det krever ofte at man hurtig kan analysere data-mengden.
- Variasjon: Dataene kommer ofte fra mange ulike kilder, og er ofte en kombinasjon av strukturerte, semistrukturerte og ustrukturerte data.
- Troverdighet: Med dataens makt og viktighet er det sentralt å ha kontroll på dataens pålitelighet og nøyaktighet.
- Verdi: Når vi snakker om big data, er det ofte data som har en personlig, økonomisk, ideell eller samfunnsmessig verdi.