Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/22814
Author: Ζιώγα, Κωνσταντίνα
Title: Χρήση μηχανικής μάθησης με ανοιχτά κυβερνητικά δεδομένα στο δημόσιο τομέα
Date Issued: 2019
Department: Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα
Supervisor: Ταραμπάνης, Κωνσταντίνος
Abstract: Η έννοια της μηχανικής μάθησης είναι γνωστή εδώ και δεκαετίες, αλλά τα τελευταία χρόνια γίνεται όλο και πιο δημοφιλής όχι μόνο στον χώρο των επιχειρήσεων αλλά και στο δημόσιο τομέα. Η ανάγκη αποδοτικότερης λήψης αποφάσεων οδηγεί πλέον τους δημόσιους φορείς στην υιοθέτηση λύσεων βασισμένες σε τεχνικές μηχανικής μάθησης. Επιπρόσθετα, ο όγκος των ανοιχτών κυβερνητικών δεδομένων αυξάνεται με εκθετικό ρυθμό με αποτέλεσμα ο δημόσιος τομέας να εκσυγχρονίζεται αξιοποιώντας τη μηχανική μάθηση στα ανοιχτά κυβερνητικά δεδομένα για την υποστήριξη της λήψης αποφάσεων. Στην παρούσα διπλωματική εργασία θα ασχοληθούμε με τη διερεύνηση της χρήσης της μηχανικής μάθησης στο τμήμα Αδειών και Επιθεωρήσεων της Φιλαδέλφεια και την πρόβλεψη της έκβασης της επιθεώρησης ακινήτων. Στόχοι της διπλωματικής εργασίας είναι η διερεύνηση της πύλης ανοιχτών δεδομένων OpenDataPhilly, η εύρεση και η περιγραφή των συνόλων δεδομένων που θα χρησιμοποιηθούν και τελικά η ανάπτυξη μοντέλων πρόβλεψης πραγματοποιώντας καθαρισμό των δεδομένων και δημιουργία γνωρισμάτων από εξωτερικά σύνολα δεδομένων, επιλογή κατάλληλων γνωρισμάτων και εκπαίδευση των αλγορίθμων μηχανικής μάθησης. Το μοντέλο πρόβλεψης βασίζεται στη λύση που ανάπτυξε μια εταιρία της Φιλαδέλφεια. Για την επιλογή των γνωρισμάτων χρησιμοποιήθηκε ο αλγόριθμος Boruta και για το μοντέλο πρόβλεψης οι αλγόριθμοι Logistic Regression, Gradient Boosting Machine και Random Forest. Ο αλγόριθμος boruta ενέκρινε την πλειοψηφία των νέων γνωρισμάτων για χρήση στο μοντέλο πρόβλεψης. Η αξιολόγηση των μοντέλων έγινε μέσω των μετρικών του confusion matrix, της καμπύλης ROC και του δείκτη AUC. Το μοντέλο Gradient Boosting Machine παρουσίασε μεγαλύτερη ακρίβεια πρόβλεψης σε σχέση με τα μοντέλα Logistic Regression και Random Forest.
Keywords: Μηχανική μάθηση
Ανοιχτά κυβερνητικά δεδομένα
Δημόσιος τομέας
Μοντέλο πρόβλεψης
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2019.
Rights: Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Appears in Collections:ΔΠΜΣ Πληροφοριακά Συστήματα (M)

Files in This Item:
File Description SizeFormat 
ZiogaKonstantinaMsc2019.pdf2.7 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons