Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/14323
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorΡεφανίδης, Ιωάννηςel
dc.contributor.authorΠαπαχρήστου, Νικόλαοςel
dc.date.accessioned2011-04-06T07:19:11Z-
dc.date.available2011-04-06T07:19:11Z-
dc.date.issued2010en
dc.identifier.urihttp://dspace.lib.uom.gr/handle/2159/14323-
dc.descriptionΔιπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2010.el
dc.description.abstractΤα παιχνίδια δύο ατόμων όπως το σκάκι, το τάβλι, το go, κ.ά. έχουν αναγνωριστεί ως ιδανικά πεδία έρευνας και δοκιμών για τις σύγχρονες μεθόδους τεχνητής νοημοσύνης και μηχανικής μάθηθης. Μία από τις πιο ενδιαφέρουσες διαδικασίες μάθησης που μπορεί να εφαρμοστεί σε αυτά είναι η ενισχυτική μάθηση μέσω της αυτοεκπαίδευσης. Με αυτήν την τεχνική ένας πράκτορας παίζει πολλές παρτίδες με τον εαυτό του και χρησιμοποιεί ένα σήμα «ανταμοιβής» στο τέλος κάθε παρτίδας, για να βελτιώσει σταδιακά την ποιότητα της επιλογής των κινήσεων. Σημαντικότερος εκπρόσωπος αυτής της μεθόδου είναι το πρόγραμμα TD-Gammon του Tesauro. Στην εργασία αυτή επιχειρείται η κατασκευή ενός πράκτορα που να παίζει τα παιχνίδια του ταβλιού «πλακωτό» και «φεύγα». Κατά το πρότυπο του TD-Gammon, ο πράκτοράς μας μαθαίνει από την έκβαση των παρτίδων αυτοεκπαίδευσης χρησιμοποιώντας ένα τεχνητό νευρωνικό δίκτυο για την εκμάκθηση της συνάρτησης αξιολόγησης των παιχνιδιών αυτών. Τέλος, συγκρίνουμε τις διάφορες εκδόσεις των εκπαιδευμένων πρακτόρων μεταξύ τους καθώς και με το πρόγραμμα ανοικτού κώδικα Tavli3D.el
dc.format.extent116en
dc.format.extent3116128 bytes-
dc.format.mimetypeapplication/pdf-
dc.language.isoelen
dc.publisherΠανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών.el
dc.subjectΕνισχυτική μάθησηen
dc.subjectΤάβλιen
dc.subjectReinforcement learningen
dc.subjectBackgammonen
dc.subjectTD(λ)en
dc.subjectTemporal difference learningen
dc.subjectΠλακωτόel
dc.subjectΦεύγαel
dc.subjectΝευρωνικά Δίκτυαel
dc.subjectNeural Networksen
dc.titleΕνισχυτική μάθηση σε παιχνίδια δύο ατόμων: εφαρμογή στο τάβλιel
dc.typeElectronic Thesis or Dissertationen
dc.typeTexten
dc.contributor.departmentΠρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορικήel
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
PapachristouMsc2010.pdf3.04 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons