Diventa Data scientist
Il corso è al completo!
A breve le date della prossima edizione
Il corso è al completo!
A breve le date della prossima edizione
Descrizione del corso
La Data Science è uno degli ambiti fondamentali dell’innovazione degli ultimi decenni: ogni campo ormai dà grande importanza ai dati, fonti indispensabili di conoscenza in vari ambiti. Nel 2017, la Harvard Business Review ha definito quella dello scienziato dei dati come la “professione più attraente del XXI secolo” e un’analisi realizzata nel 2018 dall’”Osservatorio Big Data Analytics & Business Intelligence” del Politecnico di Milano ha confermato che si tratti della competenza più ricercata dalle aziende. Si tratta ormai di una disciplina trasversale che non si occupa della sola gestione dei dati ma della loro valorizzazione per il mondo dell'informazione e per la data economy.
Il corso introduce ai metodi per estrarre scientificamente conoscenza e informazioni dai dati attraverso l'utilizzo di Python - uno dei linguaggi di programmazione più utilizzati al mondo - per manipolare i dataset, studiarne le proprietà e visualizzarle, formulare dei modelli per analizzarli e comprenderne il contenuto, e infine comunicare le conclusioni nel modo più efficace. Il corso è completamente hands-on, su dati veri e non richiede conoscenze pregresse. I tantissimi open data disponibili in rete permettono a chiunque di mettere in pratica gli insegnamenti fin dal primo momento, pubblicando le proprie conclusioni.
Cosa imparerai
Docenti
Come funziona il corso
Il corso dura 30 ore tra lezioni video ed esercitazioni pratiche, con l’alternanza di moduli on demand e lezioni live con i docenti, in cui risolvi dubbi, correggi le esercitazioni e approfondisci le tematiche che più ti interessano.
Online dal 3 maggio 2021.
La partenza del corso verrà confermata al raggiungimento del numero minimo di iscritti.
È possibile concordare modalità di pagamento personalizzate.
Le tappe del percorso
I dati sono parte fondamentale del processo di conoscenza scientifica tramite osservazione, formulazione e test delle ipotesi. Cos'è la data science, motivazioni, applicazioni, esempi, cenni storici. Setup di un data science notebook.
Alcuni strumenti assistono i data scientist in ogni fase del loro lavoro. Python e Jupyter, Pandas, il metodo di exploratory data analysis, Git e versionamento. Esempi pratici.
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Una sessione per fare il punto della situazione sull'andamento del corso
La maggior parte dei dati, in qualunque formato, può essere ricondotta a un formato tabulare. Approfondiamo come caricare e gestire dati tabulari, geografici, temporali, testuali e media, relazionali. Impariamo inoltre dove trovare o creare dataset simili, come anonimizzare eventuali dati sensibili, come esplorarli. Estrarre dati da un sito web. Teoria e approcci pratici sulle più frequenti operazioni di pulizia di un dataset e di trasformazione del dataset nella forma più utile. Esempi approfonditi ed esercitazioni pratiche.
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Una sessione per fare il punto della situazione sull'andamento del corso
Come importare, esplorare e visualizzare alcuni open dataset, come i dati del bikesharing di un'intera città o i dati estratti da una partita di calcio.
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Una guida pratica ai modelli statistici e a come usarli per estrarre patterns dai dati. Teoria e approcci pratici sulla formulazione di ipotesi scientifiche e la verifica delle stesse tramite visualizzazione dei dati e modellazione. Segnale, rumore e varianza spiegata, estrazione di pattern dai dati, clustering e PCA, regressione, tree based methods, accenno al machine learning, accenno alla libreria Sklearn. Esempi approfonditi ed esercitazioni pratiche.
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Una sessione per fare il punto della situazione sull'andamento del corso
I dati sono una risorsa, la privacy è un diritto. I dati come bene pubblico. Le leggi europee sulla richiesta di open data al settore pubblico. Le leggi europee sui dati personali e sulla privacy.
Come rendere utilizzabili i tuoi risultati, scrivere e presentare al meglio le proprie conclusioni, facendo leva sulla visualizzazione dei dati e sullo storytelling. Produci il tuo strumento per creare dei report interattivi. Esempi ed esercitazioni pratiche.
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Una sessione per fare il punto della situazione sull'andamento del corso
Modella e visualizza alcuni open dataset, proseguendo le dimostrazioni già affrontate durante il corso
Un'esercitazione da svolgere in autonomia e da riconsegnare ai docenti del corso
Un ultimo incontro per chiarire i dubbi e le questioni ancora rimasti