Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/16231
Author: Φλώρου, Γιαννούλα
Title: Προσδιορισμός της ιδανικότερης μετρικής απόστασης και καλύτερου τρόπου ομαδοποίησης στις διάφορες μεθόδους της αυτόματης ταξινόμησης κατά αύξουσα ιεραρχεία.
Alternative Titles: Best distance and best way grouping data determination for various hierarchical clustering glomerative methods.
Date Issued: 1997
Department: Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Τμήμα Εφαρμοσμένης Πληροφορικής (ΕΠ)
Supervisor: Παπαδημητρίου, Ιωάννης
Abstract: Στόχος της διατριβής είναι η μελέτη και παρουσίαση τόσο της θεωρητικής όσο και της πρακτικής διαδικασίας που ακολουθούμε για την επεξεργασία και ανάλυση δεδομένων μιας στατιστικής έρευνας, με την ιεραρχική ταξινόμηση. Αρχικά προτείνουμε τρόπους παρουσίασης δεδομένων σε μορφή πίνακα και το καταλληλότερο κάθε φορά μέτρο (μετρική ή δείκτη) απόστασης ή ομοιότητας, για να ποσοτικοποιήσουμε τη σχέση ομοιότητας μεταξύ δύο αντικειμένων ή δύο μεταβλητών. Κατόπιν προτείνουμε ένα κριτήριο που θα μας βοηθήσει να επιλέξουμε την καταλληλότερη "μετρική" απόστασης μεταξύ ομάδων (κλάσεων) αντικειμένων, το οποίο βασίζεται στο λόγο της ερμηνευόμενης αδράνειας (διασποράς) εντός διαμελισμού, ως προς την αρχική ολική αδράνεια. Αυτό το κριτήριο μας βοηθάει επίσης, να επιλέξουμε το διαμελισμό με πλήθος κλάσεων καλύτερα προσαρμοσμένο στα αρχικά δεδομένα, και επίσης τον καλύτερο διαμελισμό για καθορισμένο πλήθος κλάσεων. Ακόμη, προτείνουμε τρόπους για την εύρεση των μεταβλητών, που συμβάλλουν στη δημιουργία των κλάσεων ενός διαμελισμού, που ερμηνεύουν τις κλάσεις αυτές αλλά και τις μεταβλητές εκείνες που συντελούν στη διάσπαση των κλάσεων και ερμηνεύουν τις βασικές διαφορές μεταξύ τους. Ακολούθως περιγράφουμε τη συνεπαγωγκή ταξινόμηση, με την οποία, εντοπίζουμε τις σχέσεις συνεπαγωγής σε ένα σύνολο μεταβλητών, και τη συμβολική ταξινόμηση που χρησιμοποιείται για "συμβολική" αντικείμενα, προτείνοντας ένα νέο μέτρο ομοιότητας. Τέλος, προτείνουμε έναν εύκολο και πρωτότυπο τρόπο για την αντιστοίχιση μιας νέας μεταβλητής στα αντικείμενο κάθε κλάσης, χρησιμοποιώντας τα αποτελέσματά του.
The aim of this dissertation is the study and the representation of both theoretical and practical procedure that we follow in order to analyze the given data of one statistic survey with cluster analysis. First, we suggest ways of representing of data that are elements of a table, as well as the most appropriate measure (metric or index of distance or index of similarity), in order to measure the relation of similarity between two objects or two variables. Then we suggest a criterion which will help us choose the most appropriate metric between classes of objects, which is based on the ratio of the interpretative dispertion of a partition to the initial data (total) despertion. The suggested criterion will also help us to choose the best adjusted partition to the data, as well as the best partition for defined multitude classes. Having chosen the best partition of data, we suggest a way to determine the variables that contribute in the creation of clesses, the explanation of these classes as well as those variables that contribute in the separation of classes and explain the basic difference between them after that, we describe the implication classification by which we can identify the connection of implication in a set of variables, and the symbolic classification which is used for "symbolic” objects, suggesting a new measure of similarity. Finally, we suggest an easy and unique way for the correspondence of a new variable to the objects of each class, using the results of a classification dendrogram.
Keywords: Aνάλυση δεδομένων
Βέλτιστος διαμελισμός
Μετρική απόσταση
Ομαδοποίηση δεδομένων
Παρουσίαση δεδομένων
Συμβολική ανάλυση δεδομένων
Συνεπαγωγική ανάλυση
Ταξινόμηση ιεραρχική
Information: Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή.
Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 1997.
Περιλαμβάνει βιβλιογραφικές αναφορές (σ.199-205).
001/1997
Rights: Το ψηφιακό τεκμήριο της διατριβής αποτελεί παραχώρηση του Εθνικού Αρχείου Διδακτορικών Διατριβών που τηρεί το Εθνικό Κέντρο Τεκμηρίωσης σύμφωνα με το αρ. 22 του Ν. 2121/1993
Appears in Collections:Τμήμα Εφαρμοσμένης Πληροφορικής (Δ)

Files in This Item:
File Description SizeFormat 
PhlorouGiannoula_Phd1997.pdf11.07 MBAdobe PDFView/Open


Items in Psepheda are protected by copyright, with all rights reserved, unless otherwise indicated.