Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://dspace.lib.uom.gr/handle/2159/13922
Συγγραφέας: Καραμητόπουλος, Λεωνίδας
Τίτλος: Time series data mining: enhancementsin univariate and multivariate representations distance measures and time series similarity search
Αλλοι τίτλοι: Εξόρυξη γνώσης από χρονοσειρές: βελτιώσεις σε τεχνικές αναπαράστασης, μέτρησης αποστάσεων και αναζήτησης ομοιότητας σε μονομεταβλητές και πολυμεταβλητές χρονοσειρές
Ημερομηνία Έκδοσης: 2008
Τμήμα: Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Τμήμα Εφαρμοσμένης Πληροφορικής. (ΕΠ)
Επόπτης Καθηγητής: Ευαγγελίδης, Γεώργιος
Περίληψη: Στην παρούσα διατριβή, διερευνούμε διάφορες τεχνικές για την αποτελεσματική εφαρμογή μεθόδων Εξόρυξης Πληροφορίας σε Χρονοσειρές από μεγάλες βάσεις δεδομένων. Οι κύριες ενέργειες που πραγματοποιούνται με την εφαρμογή των μεθόδων αυτών είναι οι εξής: συσταδοποίηση, κατηγοριοποίηση, εντοπισμός καινοτομιών, ανακάλυψη μοτίβων και ανακάλυψη κανόνων. Όλες οι ενέργειες αυτές εμπεριέχουν την έννοια της ομοιότητας, αφού απαιτούν την αναζήτηση όμοιων προτύπων. Η χρονική διάσταση των δεδομένων ανακύπτει δύο βασικά ζητήματα τα οποία θα πρέπει να λαμβάνονται υπόψη κατά την αναζήτηση ομοιοτήτων. Το πρώτο ζήτημα είναι η επιλογή ενός κατάλληλου μέτρου ομοιότητας, το οποίο θα πρέπει να επιτρέπει τον εντοπισμό όμοιων χρονοσειρών οι οποίες δεν ταυτίζονται απαραιτήτως. Το δεύτερο ζήτημα είναι η αναπαράσταση (μετασχηματισμός) των χρονοσειρών με στόχο την μείωση της υψηλής διαστατότητάς τους, η οποία είναι σύμφυτη σε αυτές. Η παρούσα έρευνα εστιάζεται σε μονοδιάστατες και πολυδιάστατες χρονοσειρές. Στην πρώτη περίπτωση, η ομοιότητα αναζητείται σε χρονοσειρές μίας διάστασης, ενώ στην δεύτερη περίπτωση η ομοιότητα αναζητείται μεταξύ αντικειμένων κάθε ένα από τα οποία ορίζεται από ένα σύνολο μονοδιάστατων χρονοσειρών. Οι σημαντικότερες συνεισφορές της παρούσας εργασίας αναφέρονται στην συνέχεια. Πρώτον, προτείνεται μία μέθοδος Εξόρυξης Πληροφορίας σε Χρονοσειρές για την Αναγνώριση Προτύπων σε Διαγράμματα Ελέγχου. Αναδεικνύουμε την ικανότητα των μεθόδων Εξόρυξης Πληροφορίας σε Χρονοσειρές στην αντιμετώπιση προβλημάτων τα οποία παραδοσιακά προσεγγίζονται με μεθόδους των οποίων η αποτελεσματικότητα περιορίζεται κάθε φορά στην συγκεκριμένη εφαρμογή για την οποία έχει σχεδιαστεί. Δεύτερον, προτείνουμε μία πρωτότυπη αναπαράσταση μονοδιάστατων χρονοσειρών και ένα αντίστοιχο μέτρο ομοιότητας με σκοπό τη βελτίωση της ποιότητας της αναζήτησης ομοιοτήτων διατηρώντας την απαιτούμενη αποδοτικότητα της. Η τρίτη συνεισφορά της εργασίας αυτής συνίσταται στον προσδιορισμό μίας νέας τεχνικής η οποία στοχεύει στην επιτάχυνση της διαδικασίας αναζήτησης του εγγύτερου γείτονα μίας χρονοσειράς. Η τεχνική αυτή περιλαμβάνει την αναπαράσταση των αρχικών χρονοσειρών και τον διαχωρισμό τους σε ένα πλήθος συστάδων. Τέταρτη συνεισφορά αποτελεί η παρουσίαση μίας νέας προσέγγισης στην αναζήτηση όμοιων πολυδιάστατων χρονοσειρών. Η προσέγγιση αυτή περιλαμβάνει μία μέθοδο αναπαράστασης που βασίζεται στην τεχνική της Ανάλυσης σε Κύριες Συνιστώσες και σε μία πρωτότυπη τεχνική μέτρησης της ομοιότητας μεταξύ πολυδιάστατων αντικειμένων. Πέμπτον, η παρούσα εργασία παρέχει μία εκτεταμένη βιβλιογραφική ανασκόπηση σε μεθόδους Εξόρυξης Πληροφορίας σε Πολυδιάστατες Χρονοσειρές. Οι προτεινόμενες μέθοδοι της διατριβής αυτή έχουν αξιολογηθεί πειραματικά ως προς την ποιότητα της αναζήτησης ομοιότητας σε ένα ευρύ πλήθος πραγματικών και συνθετικών δεδομένων.
In this dissertation, we investigate various techniques for efficiently applying Time Series Data Mining methods in very large databases. The main tasks of these methods are: clustering, classification, novelty detection, motif discovery and rule discovery. At the core of these tasks lies the concept of similarity, since most of them require searching for similar patterns. The temporal nature of data arises two special issues to be considered in the process of similarity search. The first one is the definition of an appropriate similarity measure that allows imprecise matches among time series. The second issue is the representation of time series in order to reduce the intrinsically high dimensionality present in this type of data. Our research focuses on univariate, as well as, on multivariate time series. In the first case, similarity is sought among one-dimensional time series, whereas in the latter case, similarity is sought among objects, which consist of a set of time series. There are five major contributions of this work. First, we propose a Time Series Data Mining approach in the task of control chart pattern recognition. We demonstrate the capability of Time Series Data Mining techniques in handling tasks that traditionally are approached by application-specific methods. Second, we present a novel representation for dimensionality reduction along with an appropriate measure in order to improve the quality of similarity search while retaining the required efficiency. Third, we propose a new technique that aims at accelerating one-nearest neighbour similarity search. This technique involves the application of a representation on the original time series and, subsequently, the partition of the search space into a number of clusters. Fourth, we present a novel approach in multivariate time series similarity search that includes a representation based on Principal Components Analysis and a new technique of measuring similarity among multivariate objects. Fifth, we provide an extensive literature review of multivariate time series data mining. All the proposed methods in this dissertation have been experimentally evaluated on the quality of similarity search with respect to a wide range of real-world and synthetic datasets.
Λέξεις Κλειδιά: Χρονοσειρές
Εξόρυξη γνώσης
Αναζήτηση ομοιότητας
Αναπαραστάσεις
Μέτρα ομοιότητας
Time series
Data mining
Similarity search
Representations
Similarity measures
Πληροφορίες: Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή.
Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2008.
Περιλαμβάνει βιβλιογραφικές αναφορές (σ. 147-155).
005/2008
Εμφανίζεται στις Συλλογές:Τμήμα Εφαρμοσμένης Πληροφορικής (Δ)

Αρχεία σε αυτό το Τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Karamitopoulos_license.pdfΔήλωση αποδέσμευσης (Ελεγχόμενη πρόσβαση)186.07 kBAdobe PDFΠροβολή/Ανοιγμα
Karamitopoulos_Phd2008.pdf1.35 MBAdobe PDFΠροβολή/Ανοιγμα


Τα τεκμήρια στην ΨΗΦΙΔΑ προστατεύονται από πνευματικά δικαιώματα, εκτός αν αναφέρεται κάτι διαφορετικό.