Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/1653
Author: Τούτιος, Αστέριος
Title: Επεξεργασία και αναγνώριση φωνής και ομιλίας: διερεύνηση της χρήσης στοχαστικών μεθόδων για την εξαγωγή φωνητικών υπο-φθογγικών χαρακτηριστικών από το σήμα ομιλίας
Alternative Titles: Voice and speech processing and recognition: on the use of stochastic methods for the extraction of phonetic sub-phonetic features from the speech signal
Date Issued: 2006
Department: Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Τμήμα Εφαρμοσμένης Πληροφορικής. (ΕΠ)
Supervisor: Μαργαρίτης, Κωνσταντίνος
Abstract: Η παρούσα διατριβή παρουσιάζει προτάσεις για την αντιμετώπιση των προβλημάτων της απεικόνισης του σήματος ομιλίας σε πληροφορία ηλεκτρομαγνητικής αρθρωτογραφίας και σε πληροφορία ηλεκτροπαλατογραφίας. Τα δύο προβλήματα εντάσσονται στο ερευνητικό πεδίο της αντίστροφης ομιλίας το οποίο επισκοπείται στη διατριβή. Ως βασικό μεθοδολογικό εργαλείο χρησιμοποιείται η παλινδρόμηση εδραίων διανυσμάτων: Η σχετική θεωρία περιγράφεται συνοπτικά. Στην περίπτωση της απεικόνισης του σήματος ομιλίας σε πληροφορία ηλεκτρομαγνητικής αρθρωτογραφίας, επιδεικνύεται ότι η χρήση παλινδρόμησης εδραίων διανυσμάτων οδηγεί σε εκτιμήσει των αρθρωτογραφικών τροχιών, καλύτερες ή τουλάχιστον συγκρίσιμες με άλλες προσπάθειες στη βιβλιογραφία. Στην περίπτωση της απεικόνισης σε πληροφορία ηλεκτροπαλατογραφίας πραγματοποιείται μια πρωτότυπη μελέτη καθώς το πρόβλημα δεν έχει στο παρελθόν αντιμετωπιστεί σε αυτήν την έκταση με ενθαρρυντικά αποτελέσματα.
This thesis addresses the problems of mapping the acoustic speech signal onto electromagnetic articulography (EMA) and electropalatography (EPG) information. The two problems are cases of the more general speech inversion problem, which is summarized in the thesis. The main mathematical tool used is support vector regression (SVR): The related theory is briefly presented. For the acoustic-to-EMA case, it is demonstrated that SRV leads to better or at least comparable results when compared to other methods in the literature. For the acoustic-to-EPG case, an original study is conducted, since the problem has not been addressed in the past at the same extent with encouraging results.
Keywords: Αντιστροφή ομιλίας
Ηλεκτρομαγνητική αρθρωτογραφία
Ηλεκτροπαλατογραφία
Παλινδρόμηση εδραίων διανυσμάτων
Ανάλυση σε πρωτεύουσες συνιστώσες
Άρθρωση
Επεξεργασία ομιλίας
Μηχανική μάθηση
Speech inversion
Electromagnetic articulography (EMA)
Electropalatography (EPG)
Support vector regression (SVR)
Principal component analysis (PCA)
Articulation
Speech processing
Machine learning
Information: Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή.
Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2006.
Περιλαμβάνει βιβλιογραφικές αναφορές (σ. 191-213).
003/2006
Appears in Collections:Τμήμα Εφαρμοσμένης Πληροφορικής (Δ)

Files in This Item:
File Description SizeFormat 
Toutioslicense.pdfΔήλωση αποδέσμευσης (Ελεγχόμενη πρόσβαση)302.44 kBAdobe PDFView/Open
Toutios.pdf6.35 MBAdobe PDFView/Open


Items in Psepheda are protected by copyright, with all rights reserved, unless otherwise indicated.