Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/26994
Author: Λάμπου, Χρήστος
Title: Χρήση μηχανικής μάθησης σε ανοιχτά κυβερνητικά δεδομένα: πρόβλεψη κρίσιμων υγειονομικών παραβάσεων στην πόλη του Chicago
Alternative Titles: Using machine learning in open government data: predicting critical health violations in Chicago
Date Issued: 2021
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων
Supervisor: Ταραμπάνης, Κωνσταντίνος
Abstract: Η παρούσα εργασία με θέμα: «Χρήση Μηχανικής Μάθησης σε Ανοιχτά Κυβερνητικά Δεδομένα: Πρόβλεψη κρίσιμων υγειονομικών παραβάσεων στην πόλη του Chicago» διενεργήθηκε στο πλαίσιο της απόκτησης του μεταπτυχιακού διπλώματος από το Πανεπιστήμιο Μακεδονίας και συγκεκριμένα από το Π.Μ.Σ. στην Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων κατά τη διάρκεια του ακαδημαϊκού έτους 2020-21. Η συγκεκριμένη διπλωματική εργασία αποτελεί μια έρευνα προβλεπτικής αναλυτικής σχετικά με τους υγειονομικούς ελέγχους που πραγματοποιούνται στην πόλη του Chicago στις ΗΠΑ. Πρόκειται για μία ανάλυση δεδομένων από προγενέστερους υγειονομικούς ελέγχους καταστημάτων τροφίμων, με σκοπό την πρόβλεψη των κρίσιμων παραβάσεων του υγειονομικού κώδικα. Κύριος στόχος της εργασίας είναι να εξεταστεί αν στους υγειονομικούς ελέγχους κάθε επιχείρησης εντοπιστεί κρίσιμη παράβαση ή όχι. Το εν λόγω πρόβλημα εμπίπτει στην κατηγορία προβλημάτων κατηγοριοποίησης, καθώς η εξαρτημένη μεταβλητή είναι δίτιμη και λαμβάνει τις τιμές 1 (αν βρεθεί τουλάχιστον μία κρίσιμη παράβαση) ή 0 (αν δεν βρεθεί καμία κρίσιμη παράβαση). Το λογισμικό που χρησιμοποιήθηκε τόσο για την ανάλυση δεδομένων όσο και για την πρόβλεψη της εξαρτημένης μεταβλητής ήτανε ο αλγόριθμος XGBoost που υλοποιήθηκε στη γλώσσα προγραμματισμού Python. Ο XGBoost είναι ένας αλγόριθμος μηχανικής μάθησης που βασίζεται σε δέντρα αποφάσεων και θεωρείται ένας από τους πιο αποτελεσματικούς σύγχρονους αλγορίθμους στη μηχανική μάθηση (ειδικά στους διαγωνισμούς του Kaggle) λόγω της ταχύτητας εκτέλεσης και απόδοσής του. Η ερμηνεία του προβλεπτικού μοντέλου μηχανικής μάθησης της παρούσας διπλωματικής εργασίας, πραγματοποιήθηκε με τη βιβλιοθήκη SHAP της Python. Η συγκεκριμένη βιβλιοθήκη διαθέτει ενσωματωμένες λειτουργίες για τη χρήση των τιμών Shapley από τη θεωρία παιγνίων.
Keywords: Υγειονομική επιθεώρηση
κρίσιμη παράβαση
Food inspection
Critical violation
XGBoost
SHAP
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2021.
Rights: Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Appears in Collections:ΠΜΣ Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων (Μ)

Files in This Item:
File Description SizeFormat 
LampouChristosMsc2021.pdf2.66 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons