Spark ble opprinnelig utviklet på the University of California av Matei Zaharia, men allerede året etter ble Spark open source under en BSD-lisens. I 2013 ble Spark en del av Apache-familien og regnes i dag som en av de aller viktigste Apache-prosjektene. I dag er Apache Spark et utbredt verktøy innen data science og maskinlæring og naturligvis også en viktig del i mange prosjekter vi jobber med.
Ved å minimere skriving til disk og effektiv bruk av minne kan Spark raskt kjøre avanserte beregninger, noe som er helt avgjørende i mange prosjekter der sanntidsdata er essensisielt.