Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://dspace.lib.uom.gr/handle/2159/1653
Συγγραφέας: Τούτιος, Αστέριος
Τίτλος: Επεξεργασία και αναγνώριση φωνής και ομιλίας: διερεύνηση της χρήσης στοχαστικών μεθόδων για την εξαγωγή φωνητικών υπο-φθογγικών χαρακτηριστικών από το σήμα ομιλίας
Αλλοι τίτλοι: Voice and speech processing and recognition: on the use of stochastic methods for the extraction of phonetic sub-phonetic features from the speech signal
Ημερομηνία Έκδοσης: 2006
Τμήμα: Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Τμήμα Εφαρμοσμένης Πληροφορικής. (ΕΠ)
Επόπτης Καθηγητής: Μαργαρίτης, Κωνσταντίνος
Περίληψη: Η παρούσα διατριβή παρουσιάζει προτάσεις για την αντιμετώπιση των προβλημάτων της απεικόνισης του σήματος ομιλίας σε πληροφορία ηλεκτρομαγνητικής αρθρωτογραφίας και σε πληροφορία ηλεκτροπαλατογραφίας. Τα δύο προβλήματα εντάσσονται στο ερευνητικό πεδίο της αντίστροφης ομιλίας το οποίο επισκοπείται στη διατριβή. Ως βασικό μεθοδολογικό εργαλείο χρησιμοποιείται η παλινδρόμηση εδραίων διανυσμάτων: Η σχετική θεωρία περιγράφεται συνοπτικά. Στην περίπτωση της απεικόνισης του σήματος ομιλίας σε πληροφορία ηλεκτρομαγνητικής αρθρωτογραφίας, επιδεικνύεται ότι η χρήση παλινδρόμησης εδραίων διανυσμάτων οδηγεί σε εκτιμήσει των αρθρωτογραφικών τροχιών, καλύτερες ή τουλάχιστον συγκρίσιμες με άλλες προσπάθειες στη βιβλιογραφία. Στην περίπτωση της απεικόνισης σε πληροφορία ηλεκτροπαλατογραφίας πραγματοποιείται μια πρωτότυπη μελέτη καθώς το πρόβλημα δεν έχει στο παρελθόν αντιμετωπιστεί σε αυτήν την έκταση με ενθαρρυντικά αποτελέσματα.
This thesis addresses the problems of mapping the acoustic speech signal onto electromagnetic articulography (EMA) and electropalatography (EPG) information. The two problems are cases of the more general speech inversion problem, which is summarized in the thesis. The main mathematical tool used is support vector regression (SVR): The related theory is briefly presented. For the acoustic-to-EMA case, it is demonstrated that SRV leads to better or at least comparable results when compared to other methods in the literature. For the acoustic-to-EPG case, an original study is conducted, since the problem has not been addressed in the past at the same extent with encouraging results.
Λέξεις Κλειδιά: Αντιστροφή ομιλίας
Ηλεκτρομαγνητική αρθρωτογραφία
Ηλεκτροπαλατογραφία
Παλινδρόμηση εδραίων διανυσμάτων
Ανάλυση σε πρωτεύουσες συνιστώσες
Άρθρωση
Επεξεργασία ομιλίας
Μηχανική μάθηση
Speech inversion
Electromagnetic articulography (EMA)
Electropalatography (EPG)
Support vector regression (SVR)
Principal component analysis (PCA)
Articulation
Speech processing
Machine learning
Πληροφορίες: Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή.
Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2006.
Περιλαμβάνει βιβλιογραφικές αναφορές (σ. 191-213).
003/2006
Εμφανίζεται στις Συλλογές:Τμήμα Εφαρμοσμένης Πληροφορικής (Δ)

Αρχεία σε αυτό το Τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Toutioslicense.pdfΔήλωση αποδέσμευσης (Ελεγχόμενη πρόσβαση)302.44 kBAdobe PDFΠροβολή/Ανοιγμα
Toutios.pdf6.35 MBAdobe PDFΠροβολή/Ανοιγμα


Τα τεκμήρια στην ΨΗΦΙΔΑ προστατεύονται από πνευματικά δικαιώματα, εκτός αν αναφέρεται κάτι διαφορετικό.