La scienza dei dati è lo studio dell'estrazione della conoscenza dai dati. Utilizza varie tecniche da molti campi, tra cui l'elaborazione dei segnali, la matematica, la probabilità, l'apprendimento automatico, la programmazione dei computer, la statistica, l'ingegneria dei dati, la corrispondenza dei modelli e la visualizzazione dei dati, con l'obiettivo di estrarre la conoscenza utile dai dati. Con i sistemi informatici in grado di gestire più dati, i big data sono un aspetto importante della scienza dei dati.

Una persona che fa scienza dei dati è chiamata scienziato dei dati. Gli scienziati dei dati risolvono complicati problemi di dati usando la matematica, la statistica e l'informatica, anche se non sono richieste ottime competenze in queste materie. Tuttavia, uno scienziato dei dati è molto probabile che sia esperto solo in una o due di queste discipline, il che significa che i team interdisciplinari possono essere una componente chiave della scienza dei dati.

I buoni scienziati dei dati sono in grado di applicare le loro competenze per raggiungere molti tipi di scopi. Le loro abilità e competenze variano ampiamente.