Il data scientist o scienziato dei dati è una figura professionale emergente nata negli ultimi anni a seguito della enorme mole di dati generata dal traffico internet. Questo nuovo profilo professionale, molto richiesto dalle aziende, si occupa principalmente di analizzare e poi elaborare un’enorme quantità di dati al fine di ricavarne informazioni importanti.
Per fare questo il data scientist ha bisogno di conoscenze molto accurate in ambito di data mining, machine learning e big data. Il data mining, o estrazione di dati, è un metodo costituito da un insieme di tecniche automatiche o semi-automatiche per individuare correlazioni tra più variabili relative ad un singolo target. Con il data mining si estraggono e analizzano dati grazie a tecniche di estrazione automatiche o semi-automatiche al fine di fare emergere gli schemi, o pattern, sottesi e le regolarità nei comportamenti analizzati dei dati stessi.
Il data mining è utile soprattutto quando al mare magnum dei dati che circolano sul web si applica l’apprendimento automatico o machine learning. Questo settore dell’IA, l’intelligenza artificiale, si occupa di migliorare le prestazioni di un certo algoritmo nell’identificare pattern nei dati disponibili. Il machine learning di solito viene utilizzato dal data scientist in sinergia con il data mining: l’apprendimento automatico costruisce una previsione a partire dallo studio dei dati a disposizione, il data mining invece attua un’analisi esplorativa dei dati per carpirne nuovi e sconosciuti legami e proprietà. Su quali dati lavorano machine learning e data mining? Con i famosi big data, ovviamente. Ovvero un insieme così grande di dati da dover essere trattati con specifiche tecniche di analisi ed estrapolazione ad hoc. In questa nostra selezione di libri per i futuri data scientist troverete i migliori volumi disponibili su data mining, machine learning e big data.
Cliccando sulle copertine si accede alle schede complete dei libri su Amazon, con tutti i dettagli e le recensioni dei lettori. Le edizioni qui riportate sono quelle più aggiornate disponibili a giugno 2020.
Contenuti
Big Data. La guida completa per il Data Scientist
Big Data Analytics. Il manuale del data scientist
Big Data Analytics. Analizzare e interpretare dati con il machine learning
Data scientist. Tra competitività e innovazione
Big data marketing. Creare valore nella platform economy con dati, intelligenza artificiale e IoT: 1
Machine learning con Python. Costruire algoritmi per generare conoscenza: 1
Big data. Architettura, tecnologie e metodi per l’utilizzo di grandi basi di dati
Appunti sparsi di Machine Learning: Un vademecum per comprendere uno degli argomenti più affascinanti dei nostri giorni
Machine Learning Workflow: Dal prototipo alla produzione
A tu per tu col Machine Learning. L’incredibile viaggio di un developer nel favoloso mondo della Data Science
La Data Science, ovvero la Scienza dei dati, è nata nel 1974 ad opera del’informatico danese Peter Naur intendendo con essa quella disciplina che si occupa di gestire i dati a disposizione per come essi già sono senza però tentare di ricavarne della informazioni utili. Solo dopo con l’arrivo dei big data ai dati viene posta una rilevanza maggiore: si capisce quindi quanto valore anche ai fini del mercato questa enorme quantità di dati possa assumere e si studiano le tecniche adatte a riuscire a ricavare da essi importanti informazioni.
Lascia un commento