Please use this identifier to cite or link to this item:
Author: Μίγκου, Αννέτα
Title: Δημιουργία μοντέλου γνώσης με την χρήση εργαλείων του data mining του Weka
Date Issued: 2013
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Supervisor: Σαμαράς, Νικόλαος
Abstract: Ο σκοπός αυτής της διπλωματικής εργασίας είναι να εξετάσουμε πως μπορεί να δημιουργηθεί ένα μοντέλο γνώσης, με την βοήθεια εργαλείων εξόρυξης δεδομένων. Η διαδικασία που ακολουθείται ξεκινά με την προσέγγιση βασικών εννοιών της διαχείρισης της γνώσης καθώς και των πληροφοριακών συστημάτων. Η εξόρυξη δεδομένων είναι ένας επιστημονικός χώρος που χρησιμοποιεί πληθώρα εργαλείων ανάλυσης δεδομένων για να ανακαλύψει πρότυπα και σχέσεις σε δεδομένα που θα μπορέσουν να χρησιμοποιηθούν για να κάνουν έγκυρες προβλέψεις ή για τη λήψη αποφάσεων. Για την δημιουργία του εξειδικευμένου μοντέλου γνώσης θα χρησιμοποιηθεί το λογισμικό WEKA και θα δοκιμαστούν τέσσερεις διαφορετικές τεχνικές σε σύνολα δεδομένων από το UC Irvine Machine Learning Repository ( Οι αλγόριθμοι κατάταξης που θα αναλυθούν και θα δοκιμαστούν είναι οι εξής: Νευρωνικά δίκτυα (Μultilayer Perceptron), Δέντρα αποφάσεων (J48), SMO, Κ πλησιέστεροι γείτονες (IBK). Συνοπτικά, χρησιμοποιούνται σύνολα δεδομένων διαφορετικής φύσης: για κατηγοριοποίηση είδους φυτού, ποιότητας κρασιού, κατηγοριοποίησης ποιότητας αυτοκινήτου. Γίνεται ανάλυση της απόδοσης της κάθε τεχνικής ανά σύνολο δεδομένων (data set) και παρουσιάζονται αναλυτικά και συγκεντρωτικά διαγράμματα με την απόδοση των αλγορίθμων.
The goal of this thesis is to examine how a knowledge model can be created, using data mining tools. The process followed in this thesis starts be defining basic terms about knowledge management and information systems. Data mining is a research field that uses a plethora of data analysis tools for discovering patterns and relations in data. These patterns may be uses for decision making and forecasting. For creating a specialized knowledge model we will use WEKA, a software for data analysis and classification and we will use four different techniques in data sets available at UC Irvine Machine Learning Repository ( The classification algorithms that will be analyzed and used are the following: neural networks (Μultilayer Perceptron), Decision Trees (J48), SMO, Κ nearest neighbors (IBK). We will use data sets of different nature: classification of a plant, wine quality classification and car quality classification. We will analyze the effectiveness of each technique per data set and we will present detailed and aggregated diagrams depicting algorithm efficiency.
Keywords: Εξόρυξη δεδομένων
Μηχανική εκμάθηση
Data mining
Machine learning
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2013
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
MigkouAnnetaMsc2013.pdf1.42 MBAdobe PDFView/Open

Items in Psepheda are protected by copyright, with all rights reserved, unless otherwise indicated.