Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/30611
Author: Παπαδημητρίου, Νικόλαος
Title: Μείωση κατηγορικών δεδομένων εκπαίδευσης μέσω συσταδοποίησης K-modes
Date Issued: 2024
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων
Supervisor: Ουγιάρογλου, Στέφανος
Abstract: Στην πορεία του χρόνου και με την συνεχή εξέλιξη της τεχνολογίας πολλές από τις αδυναμίες που επισκιάζουν την αποτελεσματικότητα του κατηγοριποιητή εγγυτέρων γειτόνων δίνουν συνεχώς ερεθίσματα προκειμένου να αντιμετωπιστούν. Αλγόριθμοι όπως ο RHC και ο ERHC αποτελούν αποτελεσματικές τεχνικές μείωσης του όγκου των δεδομένων εκπαίδευσης μέσω της δημιουργίας ομογενών συστάδων προκειμένου να βελτιστοποιηθεί η απόδοση του κατηγοριοποιητής εγγυτέρων γειτόνων. Το μέιζον μειονέκτημα αυτών των αλγορίθμων είναι ότι μπορούν να επεξεργαστούν μόνο αριθμητικά σύνολα δεδομένων. Σκοπός της διπλωματικής αυτής εργασίας είναι η αντιμετώπιση αυτού του ζητήματος μέσω της δημιουργίας αποτελεσματικών αλγορίθμων που θα μπορούν να χειριστούν κατηγορικά δεδομένα. Ο RHC-Modes και ο ERHC-Modes βασίστηκαν πάνω στην μέθοδο συσταδοποίησης k-Modes όπου εντοπίζουν τις πιο συχνές τιμές για κάθε χαρακτηριστικό του συνόλου των κατηγορικών δεδομένων προκειμένου να δημιουργήσουν μικρότερα σύνολα δεδομένων που θα επιδιώξουν να μας προσφέρουν ιδιά ή και καλύτερη αποτελεσματικότητα. Η αποτελεσματικότητα της λειτουργίας των αλγορίθμων αυτών ελέγχθηκε πάνω σε 13 κατηγορικά σύνολα δεδομένων δίνοντας μας ικανοποιητικά αποτελέσματα. Τα ευρήματα της πειραματικής μελέτης μας επικυρωθήκαν μέσω των στατιστικών ελέγχων του Wilcoxon και του Friedman.
Keywords: Κατηγορικά σύνολα δεδομένων
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2024.
Rights: Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Appears in Collections:ΠΜΣ Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων (Μ)

Files in This Item:
File Description SizeFormat 
PapadimitriouNikolaosMsc2024.pdf1.46 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons