Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/28695
Author: Μοσχοφίδης, Χρήστος Σπυρίδων
Title: Σύγκριση μεθόδων ανάλυσης κατά συστάδες σε μεικτού τύπου δεδομένα ιστού
Date Issued: 2022
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων
Supervisor: Μάρκος, Άγγελος
Abstract: Η Ανάλυση Συστάδων (Cluster Analysis) είναι μια οικογένεια στατιστικών μεθόδων που αποσκοπούν στην ομαδοποίηση αντικειμένων ή παρατηρήσεων σε διακριτές ομάδες ή συστάδες (clusters), με βάση το πόσο «όμοια» είναι ως προς τις τιμές που λαμβάνουν σε ορισμένες μεταβλητές. Έτσι κάθε ομάδα αποτελείται από παρατηρήσεις που μοιάζουν όσο το δυνατόν περισσότερο μεταξύ τους και όσο το δυνατόν λιγότερο με τις παρατηρήσεις των άλλων ομάδων. Επιπλέον, πρόκειται για μια οικογένεια μεθόδων μη επιβλεπόμενης μάθησης (unsupervised learning), που σημαίνει ότι δεν γνωρίζουμε πόσες ομάδες υπάρχουν στα δεδομένα πριν εφαρμοστεί μια μέθοδος. Σε αντίθεση με πολλές άλλες στατιστικές μεθόδους, η Α.Σ. χρησιμοποιείται συνήθως όταν δεν υπάρχει καμία υπόθεση σχετικά με τις πιθανές σχέσεις μεταξύ των μεταβλητών. Παράλληλα, η Α.Σ μπορεί να αποτελέσει ένα ισχυρό εργαλείο ανάλυσης δεδομένων για κάθε οργανισμό ή επιχείρηση που χρειάζεται να εντοπίσει π.χ. διακριτές ομάδες πελατών, ομάδες συναλλαγών πωλήσεων ή άλλα είδη συμπεριφορών. Για παράδειγμα, οι ασφαλιστικές εταιρίες χρησιμοποιούν μεθόδους της Α.Σ. για να ανιχνεύσουν απάτες και οι τράπεζες τις χρησιμοποιούν για πιστοληπτική βαθμολόγηση των πελατών. Σκοπός της παρούσας εργασίας είναι η περιγραφή και η σύγκριση μεθόδων συσταδοποίησης για μεικτού τύπου δεδομένα. Τα μεικτού τύπου δεδομένα περιγράφονται τόσο από ποσοτικές όσο και από ποιοτικές μεταβλητές και η ανάλυσή τους με μεθόδους της Α.Σ. παρουσιάζει αρκετές προκλήσεις. Στο 2ο κεφάλαιο γίνεται μια ανασκόπηση μεθόδων Α.Σ. για μεικτού τύπου δεδομένα και παρουσιάζεται αναλυτικά το μαθηματικό υπόβαθρό τους. Στο 3ο κεφάλαιο, οι μέθοδοι εφαρμόζονται σε ένα πραγματικό σύνολο δεδομένων ιστού και γίνεται η σύγκριση των αποτελεσμάτων τους. Τα αποτελέσματα ανέδειξαν τις ομοιότητες αλλά και τις διαφορές μεταξύ των μεθόδων, χωρίς ωστόσο κάποια μέθοδος να ξεχωρίζει σημαντικά έναντι των υπολοίπων.
Keywords: Ομαδοποίηση
Συσταδοποίηση
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2022.
Rights: Αναφορά Δημιουργού 4.0 Διεθνές
Appears in Collections:ΠΜΣ Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων (Μ)

Files in This Item:
File Description SizeFormat 
MoschofidisChristosSpyridonMsc2022.pdf1.94 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons