Big Data: in questo articolo scopriremo quali sono i migliori libri di machine learning e data mining per il data scientist.
Il data scientist o scienziato dei dati è una figura professionale emergente, molto richiesta dalle aziende, nata negli ultimi anni a seguito della enorme mole di dati generata dal traffico internet.
Questo nuovo profilo professionale si occupa principalmente di analizzare ed elaborare grandi quantità di dati al fine di ricavarne informazioni ritenute utili a fini aziendali.
Per fare questo il data scientist ha bisogno di conoscenze molto accurate in ambito di data mining, machine learning e big data. Ovviamente per far questo bisogna già conoscere quelle nozioni di informatica, statistica e matematica di base necessarie per poter pensare di intraprendere questo tipo di carriera.
Il data mining, o estrazione di dati, è un metodo costituito da un insieme di tecniche automatiche o semi-automatiche per individuare correlazioni tra più variabili relative ad un singolo target. Con il data mining si estraggono e analizzano dati al fine di fare emergere gli schemi o pattern sottesi che emergono solo dopo un’attenta analisi dei dati stessi.Il data mining è utile soprattutto quando al mare magnum dei dati che circolano sul web si applica l’apprendimento automatico o machine learning. Questo settore dell’IA, l’intelligenza artificiale, si occupa di migliorare le prestazioni di un certo algoritmo nell’identificare pattern non chiaramente rilevabili nei dati disponibili.
Il machine learning di solito viene utilizzato dal data scientist in sinergia con il data mining: l’apprendimento automatico costruisce una previsione a partire dallo studio dei dati a disposizione, il data mining invece attua un’analisi esplorativa dei dati per carpirne nuovi e sconosciuti legami e proprietà. Su quali dati lavorano machine learning e data mining? Con i famosi big data, ovviamente. Ovvero un insieme così grande di dati da dover essere trattati con specifiche tecniche di analisi ed estrapolazione ad hoc.
In questa nostra selezione dei testi per i futuri data scientist troverete i migliori libri su machine learning, big data, data mining.
Cliccando sulle copertine si accede alle schede complete dei libri su Amazon, con tutti i dettagli e le recensioni dei lettori. Le edizioni qui riportate sono quelle più aggiornate disponibili.
Contenuti
Big Data: i migliori libri per il Data Scientist
Big Data. La guida completa per il Data Scientist
Big Data Analytics. Analizzare e interpretare dati con il machine learning
Big data. Architettura, tecnologie e metodi per l’utilizzo di grandi basi di dati
Big data marketing. Creare valore nella platform economy con dati, intelligenza artificiale e IoT
L’analisi dei big data con Python. Le migliori tecniche per aggregare i dati
Scienza ed ingegneria dei dati – un percorso di apprendimento in italiano – (Vol. 1-2)
Data minig e machine learning: i migliori libri sull’argomento
Data Science e Machine Learning: Dai dati alla conoscenza
In questo libro illustriamo le tecniche di analisi dei dati e di costruzione di algoritmi di Machine Learning e Deep Learning, passando dalle conoscenze teoriche alle applicazioni con il software statistico R, tramite ampi esempi pratici.
Machine learning con Python. Costruire algoritmi per generare conoscenza
Data Mining: Principali tecniche statistiche
Appunti sparsi di Machine Learning: Un vademecum per comprendere uno degli argomenti più affascinanti dei nostri giorni
Algoritmo di estrazione dati per prevedere il lupus eritematoso sistemico (SLE)
Data scientist, una nuova professione
Data scientist. Tra competitività e innovazione
La Data Science, ovvero la Scienza dei dati, è nata nel 1974 ad opera dell’informatico danese Peter Naur intendendo con essa quella disciplina che si occupa di gestire i dati a disposizione, per come essi già sono senza però tentare di ricavarne della informazioni utili. Solo dopo con l’arrivo dei big data l’attenzione viene focalizzata sui dati che acquisiscono una rilevanza maggiore: si capisce di fatti quanto valore ai fini del mercato questa enorme quantità di dati possa assumere e si studiano le tecniche adatte a riuscire a ricavare da essi quante più informazioni possibili.
Mancherebbero questi due
SCIENZA ED INGEGNERIA DEI DATI – UN PERCORSO DI APPRENDIMENTO IN ITALIANO – VOLUME 1: ASPETTI METODOLOGICI, ACQUISIZIONE DATI, GESTIONE E PULIZIA, ANALISI E VISUALIZZAZIONE CON APPLICAZIONI IN ORANGE
SCIENZA ED INGEGNERIA DEI DATI – UN PERCORSO DI APPRENDIMENTO IN ITALIANO – VOLUME 2: EXPLORATORY DATA ANALYSIS, METRICHE, MODELLI CON APPLICAZIONI NELL’AMBIENTE PYTHON-BASED ORANGE
https://www.amazon.it/dp/B0BFBMDTG4