Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι

Παπαχρήστου, Νικόλαος

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://dspace.lib.uom.gr/handle/2159/14323

Συγγραφέας:	Παπαχρήστου, Νικόλαος
Τίτλος:	Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι
Ημερομηνία Έκδοσης:	2010
Τμήμα:	Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Επόπτης Καθηγητής:	Ρεφανίδης, Ιωάννης
Περίληψη:	Τα παιχνίδια δύο ατόμων όπως το σκάκι, το τάβλι, το go, κ.ά. έχουν αναγνωριστεί ως ιδανικά πεδία έρευνας και δοκιμών για τις σύγχρονες μεθόδους τεχνητής νοημοσύνης και μηχανικής μάθηθης. Μία από τις πιο ενδιαφέρουσες διαδικασίες μάθησης που μπορεί να εφαρμοστεί σε αυτά είναι η ενισχυτική μάθηση μέσω της αυτοεκπαίδευσης. Με αυτήν την τεχνική ένας πράκτορας παίζει πολλές παρτίδες με τον εαυτό του και χρησιμοποιεί ένα σήμα «ανταμοιβής» στο τέλος κάθε παρτίδας, για να βελτιώσει σταδιακά την ποιότητα της επιλογής των κινήσεων. Σημαντικότερος εκπρόσωπος αυτής της μεθόδου είναι το πρόγραμμα TD-Gammon του Tesauro. Στην εργασία αυτή επιχειρείται η κατασκευή ενός πράκτορα που να παίζει τα παιχνίδια του ταβλιού «πλακωτό» και «φεύγα». Κατά το πρότυπο του TD-Gammon, ο πράκτοράς μας μαθαίνει από την έκβαση των παρτίδων αυτοεκπαίδευσης χρησιμοποιώντας ένα τεχνητό νευρωνικό δίκτυο για την εκμάκθηση της συνάρτησης αξιολόγησης των παιχνιδιών αυτών. Τέλος, συγκρίνουμε τις διάφορες εκδόσεις των εκπαιδευμένων πρακτόρων μεταξύ τους καθώς και με το πρόγραμμα ανοικτού κώδικα Tavli3D.
Λέξεις Κλειδιά:	Ενισχυτική μάθηση Τάβλι Reinforcement learning Backgammon TD(λ) Temporal difference learning Πλακωτό Φεύγα Νευρωνικά Δίκτυα Neural Networks
Πληροφορίες:	Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2010.
Εμφανίζεται στις Συλλογές:	Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Αρχεία σε αυτό το Τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
PapachristouMsc2010.pdf		3.04 MB	Adobe PDF	Προβολή/Ανοιγμα

Εμφανίστε την πλήρη εγγραφή Προτείνετε αυτό το τεκμήριο

Αυτό το τεκμήριο προστατεύεται από Αδεια Creative Commons

ΨΗΦΙΔΑ

Ψηφιακή Βιβλιοθήκη και Ιδρυματικό Αποθετήριο