Εθνικό Μετσόβιο Πολυτεχνείο
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών

Προγραμματιστικά Εργαλεία και Τεχνολογίες για Επιστήμη Δεδομένων

https://courses.softlab.ntua.gr/progds/

Προγραμματιστικά Εργαλεία και Τεχνολογίες για Επιστήμη Δεδομένων

Μεταπτυχιακό μάθημα, χειμερινού εξαμήνου
(ΔΠΜΣ Επιστήμη Δεδομένων και Μηχανική Μάθηση), κωδικός 716

Εξάμηνο: Χειμερινό 2020
Διδάσκοντες:
Νίκος Παπασπύρου   ()   γρ. 1.1.21 Παλιό Κτ. ΗΜΜΥ   τηλ: 210-772-3393
Δημήτρης Φουσκάκης   ()   γρ. 205 Κτίριο Ε   τηλ: 210-772-1702

Ανακοινώσεις | Υλικό: Γενικά, Περιγραφή, Σύνδεσμοι, Εργασία, Παλαιότερα έτη
Διαλέξεις: 22/9 | 24/9 | 29/9 | 1/10 | 6/10 | 8/10 | 12/11

 

Ανακοινώσεις

19/11/2020

Εργαστηριακή εξέταση, σε Python και R.

7/11/2020

Την Πέμπτη 12/11 θα γίνει μία παράδοση εργαστηρίου και την Πέμπτη 19/11 η εργαστηριακή εξέταση, και για τα δύο μέρη του μαθήματος (Python + R).

22/9/2020

Για το μέρος του μαθήματος που διδάσκεται από τον κ. Φουσκάκη (R), δείτε την αντίστοιχη ιστοσελίδα. Η παρούσα ιστοσελίδα αφορά το μέρος του μαθήματος που διδάσκεται από τον κ. Παπασπύρου (Python).

17/9/2020

Οι διαλέξεις του μαθήματος αρχίζουν την Τρίτη 22/9. Για τις πρώτες τρεις βδομάδες (εντατικά μαθήματα Python) οι διαλέξεις θα γίνονται Τρίτη και Πέμπτη, ώρα 17:00–18:00. Οι διαλέξεις θα γίνονται ηλεκτρονικά (λόγω των μέτρων πρόληψης COVID-19) στο Microsoft Teams.

Όσοι σπουδαστές διαθέτετε κωδικό ΕΜΠ, μπορείτε να συνδεθείτε απευθείας χρησιμοποιώντας τον κωδικό ομάδας sy61nlk (δείτε οδηγίες για το MS Teams). Οι σπουδαστές που δε διαθέτουν (ακόμη) κωδικό ΕΜΠ θα πρέπει να εγγραφούν ως guests. Οι φετινοί εισακτέοι του ΔΠΜΣ έχουν ήδη προστεθεί, με τα e-mail που έχουν δώσει στη γραμματεία. Άλλοι σπουδαστές που θα ήθελαν να παρακολουθήσουν το μάθημα και δε διαθέτουν κωδικό ΕΜΠ μπορούν να στέλνουν e-mail στον κ. Παπασπύρου.

 

Υλικό

Γενικά

Περιγραφή

Επεξεργασία και ανάλυση δεδομένων με τις γλώσσες Python και R. Εξερεύνηση δεδομένων και στατιστική μοντελοποίηση.

Εισαγωγή στην γλώσσα Python. Τύποι δεδομένων: Λίστες, λεξικά, κλπ. Ροή ελέγχου. Συναρτήσεις και πακέτα λογισμικού. Αντικείμενα και αντικειμενοστρέφεια. Βιβλιοθήκες επεξεργασίας και διαχείρισης δεδομένων (numpy, pandas, κλπ). Βιβλιοθήκες απεικόνισης δεδομένων (maplotlib, κλπ.). Βασικές βιβλιοθήκες μηχανικής μάθησης (scikit-learn). Εφαρμογές.

Εισαγωγή στην στατιστική γλώσσα προγραμματισμού R. Αριθμητικοί τελεστές. Βασικοί τύποι και δομές δεδομένων: διανύσματα, πίνακες, λίστες, dataframes. Δημιουργία, εισαγωγή, προ-επεξεργασία, διαχείριση και βασικοί μετασχηματισμοί δεδομένων. Ροή ελέγχου. Βιβλιοθήκες απεικόνισης δεδομένων (ggplot, κλπ.). Βασικές βιβλιοθήκες μηχανικής μάθησης (e1071, rpart, κλπ.). Εφαρμογές.

Σύνδεσμοι

Ιστοσελίδες για προπόνηση:

Εργασία

Πρόβλημα “time-travel”: ταξιδέψτε πίσω στο χρόνο και βγάλτε όσα μεγαλύτερο κέρδος μπορείτε στο χρηματιστήριο της Νέας Υόρκης!

Παλαιότερα έτη

Σελίδα του μαθήματος για τo ακαδημαϊκό έτος: 2019-20, 2018-19.

 

Διαλέξεις

Παράδοση 22/9/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Παράδοση 24/9/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Παράδοση 29/9/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Παράδοση 1/10/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Παράδοση 6/10/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Παράδοση 8/10/2020

Σημειώσεις PDF color, Jupyter notebook IPYNB και video διάλεξης IPYNB.

Εργαστήριο 12/11/2020

Jupyter notebook IPYNB και video διάλεξης IPYNB.

 

Τελευταία αλλαγή: 30/09/2020, 09:46 UTC.