Χρήση μηχανικής μάθησης με ανοιχτά κυβερνητικά δεδομένα στο δημόσιο τομέα

Ζιώγα, Κωνσταντίνα

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://dspace.lib.uom.gr/handle/2159/22814

Συγγραφέας:	Ζιώγα, Κωνσταντίνα
Τίτλος:	Χρήση μηχανικής μάθησης με ανοιχτά κυβερνητικά δεδομένα στο δημόσιο τομέα
Ημερομηνία Έκδοσης:	2019
Τμήμα:	Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα
Επόπτης Καθηγητής:	Ταραμπάνης, Κωνσταντίνος
Περίληψη:	Η έννοια της μηχανικής μάθησης είναι γνωστή εδώ και δεκαετίες, αλλά τα τελευταία χρόνια γίνεται όλο και πιο δημοφιλής όχι μόνο στον χώρο των επιχειρήσεων αλλά και στο δημόσιο τομέα. Η ανάγκη αποδοτικότερης λήψης αποφάσεων οδηγεί πλέον τους δημόσιους φορείς στην υιοθέτηση λύσεων βασισμένες σε τεχνικές μηχανικής μάθησης. Επιπρόσθετα, ο όγκος των ανοιχτών κυβερνητικών δεδομένων αυξάνεται με εκθετικό ρυθμό με αποτέλεσμα ο δημόσιος τομέας να εκσυγχρονίζεται αξιοποιώντας τη μηχανική μάθηση στα ανοιχτά κυβερνητικά δεδομένα για την υποστήριξη της λήψης αποφάσεων. Στην παρούσα διπλωματική εργασία θα ασχοληθούμε με τη διερεύνηση της χρήσης της μηχανικής μάθησης στο τμήμα Αδειών και Επιθεωρήσεων της Φιλαδέλφεια και την πρόβλεψη της έκβασης της επιθεώρησης ακινήτων. Στόχοι της διπλωματικής εργασίας είναι η διερεύνηση της πύλης ανοιχτών δεδομένων OpenDataPhilly, η εύρεση και η περιγραφή των συνόλων δεδομένων που θα χρησιμοποιηθούν και τελικά η ανάπτυξη μοντέλων πρόβλεψης πραγματοποιώντας καθαρισμό των δεδομένων και δημιουργία γνωρισμάτων από εξωτερικά σύνολα δεδομένων, επιλογή κατάλληλων γνωρισμάτων και εκπαίδευση των αλγορίθμων μηχανικής μάθησης. Το μοντέλο πρόβλεψης βασίζεται στη λύση που ανάπτυξε μια εταιρία της Φιλαδέλφεια. Για την επιλογή των γνωρισμάτων χρησιμοποιήθηκε ο αλγόριθμος Boruta και για το μοντέλο πρόβλεψης οι αλγόριθμοι Logistic Regression, Gradient Boosting Machine και Random Forest. Ο αλγόριθμος boruta ενέκρινε την πλειοψηφία των νέων γνωρισμάτων για χρήση στο μοντέλο πρόβλεψης. Η αξιολόγηση των μοντέλων έγινε μέσω των μετρικών του confusion matrix, της καμπύλης ROC και του δείκτη AUC. Το μοντέλο Gradient Boosting Machine παρουσίασε μεγαλύτερη ακρίβεια πρόβλεψης σε σχέση με τα μοντέλα Logistic Regression και Random Forest.
Λέξεις Κλειδιά:	Μηχανική μάθηση Ανοιχτά κυβερνητικά δεδομένα Δημόσιος τομέας Μοντέλο πρόβλεψης
Πληροφορίες:	Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2019.
Δικαιώματα:	Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Εμφανίζεται στις Συλλογές:	ΔΠΜΣ Πληροφοριακά Συστήματα (M)

Αρχεία σε αυτό το Τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
ZiogaKonstantinaMsc2019.pdf		2.7 MB	Adobe PDF	Προβολή/Ανοιγμα

Εμφανίστε την πλήρη εγγραφή Προτείνετε αυτό το τεκμήριο

Αυτό το τεκμήριο προστατεύεται από Αδεια Creative Commons

ΨΗΦΙΔΑ

Ψηφιακή Βιβλιοθήκη και Ιδρυματικό Αποθετήριο