Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/28143
Author: Οικονόμου, Αθανάσιος
Title: Συστήματα μηχανικής μάθησης στα χρηματοπιστωτικά ιδρύματα
Date Issued: 2022
Department: Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα
Supervisor: Καλαμπόκης, Ευάγγελος
Abstract: Στην παρούσα διπλωματική εργασία με τίτλο «Συστήματα μηχανικής μάθησης στα χρηματοπιστωτικά ιδρύματα», γίνεται εφαρμογή της τεχνητής νοημοσύνης στο χρηματοπιστωτικό τομέα. Μία από τις βασικές υπηρεσίες των χρηματοπιστωτικών ιδρυμάτων, είναι η χορήγηση δανείων. Ο αριθμός των αιτήσεων που λαμβάνονται για δάνεια είναι μεγάλος και ο προβληματισμός είναι αν ένα δάνειο θα αποπληρωθεί εφόσον η αίτησή του εγκριθεί. Με κάθε νέα αίτηση, συγκεντρώνεται μία πληθώρα στοιχείων σχετικά με τον αιτούντα, συνδυασμός των οποίων ενδέχεται να είναι αποτρεπτικός ή όχι στο να εγκριθεί μία αίτηση. Στα πλαίσια της διπλωματικής εργασίας, αξιοποιήθηκαν τα σύνολα δεδομένων που διέθεσε η Home Credit στην πλατφόρμα της Kaggle, με σκοπό τη διενέργεια διαγωνισμού μηχανικής μάθησης με θέμα «Home Credit Default Risk. Can you predict how capable each applicant is of repaying a loan?». Με την κατανόηση των δεδομένων, ακολούθησε η διερευνητική ανάλυση αυτών, συνοδευόμενη από γραφικές απεικονίσεις με τη χρήση της εφαρμογής Tableau. Στη φάση της προεργασίας, δημιουργήθηκαν νέες παράμετροι οι οποίες ενσωματώθηκαν με τις υφιστάμενες σε ένα τελικό σύνολο δεδομένων. Μερικά από τα δεδομένα ήταν αναγκαίο να μετατραπούν ώστε να είναι δυνατή η περαιτέρω επεξεργασία τους. Για το μοντέλο που δημιουργήθηκε, αξιοποιήθηκε η ενισχυτική διαβάθμιση δέντρων αποφάσεων (GBDT) με τη χρήση της βιβλιοθήκης XGBoost (Extreme Gradient Boosting). Ο συντονισμός των υπερπαραμέτρων επιτεύχθηκε με την Αναζήτηση Πλέγματος (Grid Search) της βιβλιοθήκης Scikit-learn. Η διαχείριση των πινάκων έγινε με συναρτήσεις της βιβλιοθήκης NumPy η οποία διαθέτει μια μεγάλη συλλογή μαθηματικών συναρτήσεων. Για τη δημιουργία γραφημάτων, χρησιμοποιήθηκε η συλλογή συναρτήσεων pyplot της βιβλιοθήκης matplotlib. Το μοντέλο αξιολογήθηκε με το ποσοστό του AUC ROC score (Area Under the ROC (Receiver Operating Characteristic) Curve). Επιπλέον, έγινε η ανεύρεση των σημαντικότερων από τις παραμέτρους του συνόλου δεδομένων. Η μηχανική μάθηση, αξιοποιώντας σωστά τα ακριβή και μεγάλα σύνολα δεδομένων, μπορεί να συμβάλλει σημαντικά στη πρόγνωση των τομέων της οικονομίας.
Keywords: Σύνολο δεδομένων
μεγάλα δεδομένα
Επιστήμη δεδομένων
Επιχειρηματική ευφυία
Λήψη αποφάσεων
Τεχνητή νοημοσύνη
Μηχανική μάθηση
Αλγόριθμος μηχανικής μάθησης
Tableau
Kaggle
Home credit
Jupyter notebook
Python
Grid search
Xgboost
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2022.
Appears in Collections:ΔΠΜΣ Πληροφοριακά Συστήματα (M)

Files in This Item:
File Description SizeFormat 
OikonomouAthanasiosMsc2022.pdf2.41 MBAdobe PDFView/Open


Items in Psepheda are protected by copyright, with all rights reserved, unless otherwise indicated.