Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι

Παπαχρήστου, Νικόλαος

Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/14323

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Ρεφανίδης, Ιωάννης	el
dc.contributor.author	Παπαχρήστου, Νικόλαος	el
dc.date.accessioned	2011-04-06T07:19:11Z	-
dc.date.available	2011-04-06T07:19:11Z	-
dc.date.issued	2010	en
dc.identifier.uri	http://dspace.lib.uom.gr/handle/2159/14323	-
dc.description	Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2010.	el
dc.description.abstract	Τα παιχνίδια δύο ατόμων όπως το σκάκι, το τάβλι, το go, κ.ά. έχουν αναγνωριστεί ως ιδανικά πεδία έρευνας και δοκιμών για τις σύγχρονες μεθόδους τεχνητής νοημοσύνης και μηχανικής μάθηθης. Μία από τις πιο ενδιαφέρουσες διαδικασίες μάθησης που μπορεί να εφαρμοστεί σε αυτά είναι η ενισχυτική μάθηση μέσω της αυτοεκπαίδευσης. Με αυτήν την τεχνική ένας πράκτορας παίζει πολλές παρτίδες με τον εαυτό του και χρησιμοποιεί ένα σήμα «ανταμοιβής» στο τέλος κάθε παρτίδας, για να βελτιώσει σταδιακά την ποιότητα της επιλογής των κινήσεων. Σημαντικότερος εκπρόσωπος αυτής της μεθόδου είναι το πρόγραμμα TD-Gammon του Tesauro. Στην εργασία αυτή επιχειρείται η κατασκευή ενός πράκτορα που να παίζει τα παιχνίδια του ταβλιού «πλακωτό» και «φεύγα». Κατά το πρότυπο του TD-Gammon, ο πράκτοράς μας μαθαίνει από την έκβαση των παρτίδων αυτοεκπαίδευσης χρησιμοποιώντας ένα τεχνητό νευρωνικό δίκτυο για την εκμάκθηση της συνάρτησης αξιολόγησης των παιχνιδιών αυτών. Τέλος, συγκρίνουμε τις διάφορες εκδόσεις των εκπαιδευμένων πρακτόρων μεταξύ τους καθώς και με το πρόγραμμα ανοικτού κώδικα Tavli3D.	el
dc.format.extent	116	en
dc.format.extent	3116128 bytes	-
dc.format.mimetype	application/pdf	-
dc.language.iso	el	en
dc.publisher	Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών.	el
dc.subject	Ενισχυτική μάθηση	en
dc.subject	Τάβλι	en
dc.subject	Reinforcement learning	en
dc.subject	Backgammon	en
dc.subject	TD(λ)	en
dc.subject	Temporal difference learning	en
dc.subject	Πλακωτό	el
dc.subject	Φεύγα	el
dc.subject	Νευρωνικά Δίκτυα	el
dc.subject	Neural Networks	en
dc.title	Ενισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλι	el
dc.type	Electronic Thesis or Dissertation	en
dc.type	Text	en
dc.contributor.department	Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική	el
Appears in Collections:	Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:

File	Description	Size	Format
PapachristouMsc2010.pdf		3.04 MB	Adobe PDF	View/Open

Show simple item record Recommend this item

This item is licensed under a Creative Commons License

PSEPHEDA

Digital Library and Institutional Repository