Apache Hadoop er et open source-rammeverk som brukes til å lagre og behandle store datasett. I stedet for å bruke en stor datamaskin til å lagre og behandle dataene, muliggjør Hadoop clustering av flere datamaskiner for å analysere de massive datasettene parallelt og mye raskere.

Hadoop-økosystemet har vokst betydelig gjennom årene på grunn av dets utvidelsesmuligheter. I dag inkluderer Hadoop-økosystemet mange verktøy og applikasjoner som hjelper deg med å samle, lagre, behandle, analysere og administrere big data, inkludert blant annet Spark, Presto, Hive, HBase og Zeppelin.

Noe av de som gjør Hadoop så populært, er ikke bare evnen til å å håndtere store datamengder på en rask måte, men også fordi Hadoop reduserer sjansen for feil, fleksibiliten er stor, det er ingen lisenskostnader og det er lett å skalere løsningen.

For oss i Sannsyn handler alt om å skape verdi ut av store datamengder. Hadoop er i denne sammenhengen blitt et viktig verktøy.