Μελέτη του περιβάλλοντος scikit-multiflow για την εξόρυξη γνώσης σε δεδομένα ροής

Σταυρίδης, Απόστολος

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://dspace.lib.uom.gr/handle/2159/24589

Πλήρης εγγραφή μεταδεδομένων

Πεδίο DC	Τιμή	Γλώσσα
dc.contributor.advisor	Ευαγγελίδης, Γεώργιος	el
dc.contributor.author	Σταυρίδης, Απόστολος	el
dc.date.accessioned	2020-12-01T14:20:06Z	-
dc.date.available	2020-12-01T14:20:06Z	-
dc.date.issued	2020	el
dc.identifier.uri	http://dspace.lib.uom.gr/handle/2159/24589	-
dc.description	Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2020.	el
dc.description.abstract	Στο υπολογιστικό μοντέλο των ροών δεδομένων, τα δεδομένα φθάνουν συνεχώς σε μια δυνητικά άπειρη ροή η οποίο πρέπει να υποβληθεί σε επεξεργασία από ένα σύστημα με περιορισμένους πόρους. Ο κύριος περιορισμός είναι ότι η κύρια μνήμη είναι μικρή και μπορεί να περιέχει μόνο ένα μικρό τμήμα του stream, επομένως τα περισσότερα δεδομένα πρέπει να απορρίπτονται αμέσως μετά την επεξεργασία. Η διαδικτυακή μάθηση ενημερώνει το μοντέλο της μετά από κάθε εμφάνιση δεδομένων χωρίς πρόσβαση σε όλα τα δεδομένα του παρελθόντος, εξ ου και ισχύουν οι περιορισμοί του υπολογιστικού μοντέλου ροής δεδομένων. Η ροή δεδομένων δεν είναι απλώς ένας τεχνικός περιορισμός στη μηχανική μάθηση, καθώς τα γρήγορα δεδομένα δεν αφορούν μόνο την ισχύ επεξεργασίας αλλά και τη γρήγορη σημασιολογία. Το scikit-multiflow αποτελεί ένα περιβάλλον μηχανικής μάθησης και εξόρυξης γνώσης ανοικτού κώδικα για δεδομένα πολλαπλών εξόδων / πολλαπλών ετικετών και ροών δεδομένων. Στην τρέχουσα κατάσταση του, το scikit-multiflow περιέχει γεννήτριες ροών δεδομένων, κατηγοριοποιητές πολλαπλών εξόδων / πολλαπλών ετικετών δεδομένων ροής, ανιχνευτές αλλαγής και μεθόδους αξιολόγησης. Σκοπός της μελέτης είναι η διερεύνηση και η σύγκριση υλοποιημένων αλγορίθμων κατηγοριοποίησης του scikit-multiflow πάνω σε ροές δεδομένων. Στην εργασία παρουσιάζεται ένα παράδειγμα, εργασίας ταξινόμησης στο οποίο χρησιμοποιείται η γεννήτρια SEA, της οποίας τα δεδομένα χρησιμοποιήθηκαν για την εκπαίδευση και τη σύγκριση ενός ταξινομητή Naive Bayes και ενός SGDClassifier. Παρόλο που o NaiveBayes παρουσίασε καλύτερη απόδοση στην αρχή της ροής, o SGDClassifier τελικά είχε λίγο καλύτερη απόδοση. Ο NaiveBayes ήταν γρηγορότερος και δέσμευσε ελαφρώς περισσότερη μνήμη, ωστόσο ο SGDClassifier αν και πιο αργός παρουσίασε μικρότερο αποτύπωμα μνήμης. Για την μελέτη της επίδρασης της απόκλισης στη μάθηση συγκρίθηκαν δύο δημοφιλή μοντέλα ροής, το HoeffdingTreeClassifier και η εκδοχή του HoeffdingAdaptiveTreeClassifier που λαμβάνει υπόψη την απόκλιση. Το HoeffdingAdaptiveTreeClassifier πέτυχε καλύτερη απόδοση ενώ απαιτούσε λιγότερο χώρο στη μνήμη. Αυτό δείχνει ότι έχει εφαρμοστεί ο μηχανισμός αντικατάστασης κλάδου που ενεργοποιείται από το ADWIN, με αποτέλεσμα μια λιγότερο περίπλοκη δομή δέντρου να αντιπροσωπεύει τα δεδομένα.	el
dc.format.extent	64	el
dc.language.iso	el	en
dc.publisher	Πανεπιστήμιο Μακεδονίας	el
dc.subject	Ροές Δεδομένων	el
dc.subject	Scikit-Multiflow	en
dc.subject	Εξόρυξη Γνώσης	el
dc.title	Μελέτη του περιβάλλοντος scikit-multiflow για την εξόρυξη γνώσης σε δεδομένα ροής	el
dc.type	Electronic Thesis or Dissertation	en
dc.type	Text	en
dc.contributor.department	Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική	el
Εμφανίζεται στις Συλλογές:	Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Αρχεία σε αυτό το Τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
StauridisApostolosMsc2020.pdf		1.01 MB	Adobe PDF	Προβολή/Ανοιγμα
StauridisApostolosMsc2020present.pdf		1.26 MB	Adobe PDF	Προβολή/Ανοιγμα

Εμφανίστε την απλή εγγραφή Προτείνετε αυτό το τεκμήριο

Τα τεκμήρια στην ΨΗΦΙΔΑ προστατεύονται από πνευματικά δικαιώματα, εκτός αν αναφέρεται κάτι διαφορετικό.

ΨΗΦΙΔΑ

Ψηφιακή Βιβλιοθήκη και Ιδρυματικό Αποθετήριο