les Thèses Soutenues à l'USTO MB
vous cherchez une thèse?
A partir de cette page vous pouvez :
Retourner au premier écran avec les recherches... | Votre compte |
Détail de l'auteur
Auteur MERAD-BOUDIA Nihal
Documents disponibles écrits par cet auteur



Développement d'un système de reconnaissance de parole arabe pour des mots connectés en utilisant HTK / MERAD-BOUDIA Nihal
![]()
Titre : Développement d'un système de reconnaissance de parole arabe pour des mots connectés en utilisant HTK Type de document : document électronique Auteurs : MERAD-BOUDIA Nihal, Auteur ; BENYETTOU Abdelkader, Directeur de thèse ; BOUGHANMI Nabil, Directeur de thèse Année de publication : 2017—2018 Accompagnement : CD Langues : Français (fre) Catégories : Informatique:informatique Mots-clés : Reconnaissance de Parole Arabe, outil HTK, Modèle Acoustique, Dépendant du Contexte, Indépendant du Contexte, GMM. Résumé : Dans ce travail de thèse, nous décrivons et proposons une méthode efficace de reconnaissance de la parole arabe continue indépendante du locuteur, basée sur un corpus vocal phonétiquement riche. Ce corpus de parole contient deux ensembles de données : (1) les chiffres arabes parlés (SAD), enregistrés par 66 locuteurs (33 hommes et 33 femmes), prennent 6600 mots de chiffres dans lesquels chaque locuteur prononce chaque chiffre de zéro à neuf dix fois, et (2) : le second ensemble de données est restreint aux phrases coraniques de trois locuteurs célèbres avec les règles de Tajweed (une sorte de chant) des trente derniers chapitres (Sourate) du Saint Coran.
Nous traitons la problématique générale de la reconnaissance de la parole qui est la coarticulation avec les modèles dépendants du contexte : tri-phones comme modèle acoustique, et les bi-grams comme modèle de langage qui était le plus approprié dans ce texte. Nous traitons le problème particulier d'ajustement de la durée de son avec les tri-phones étendus aux modèles de mélanges Gaussiens (GMM).
Le système de reconnaissance de la parole arabe proposé est basé sur l’outil qui manipule les modèles de Markov cachés : HMM Toolkit (HTK) de l’université de Cambridge. Des tests expérimentaux montrent que l'ensemble de données de chiffres utilisant trois états émettant par phonème (son), a un excellent résultat de reconnaissance de mots qui est de 97,95 %. Le taux de reconnaissance des phrases est de 93,14 %.
Le meilleur résultat des versets coraniques obtenus est de 73,44 % de mots reconnus, et de 14,38 % de phrases reconnues. Un taux de 66,09% de précision chez le lecteur « Elmirigli ».
L'adaptation du système de base à la voix d'intonation du lecteur, puis l'application d'un GMM approprié à chaque tri-phone de liste liée, dépasse l'expérience du modèle acoustique HMM-triphone par un taux de mots reconnus de 16,93 % chez le lecteur « Alsudaissi » grâce au problème des voyelles de longue durée (appelée en arabe mudud) résolu.
Notre contribution est d'appliquer des tri-phones étendus aux modèles GMM qui est comparé à la méthode de Régression Linéaire à Ressemblance Maximum (MLLR), et de les dépasser de près de 5 % chez le lecteur « Alsudaissi ».
Développement d'un système de reconnaissance de parole arabe pour des mots connectés en utilisant HTK [document électronique] / MERAD-BOUDIA Nihal, Auteur ; BENYETTOU Abdelkader, Directeur de thèse ; BOUGHANMI Nabil, Directeur de thèse . - 2017—2018 . - + CD.
Langues : Français (fre)
Catégories : Informatique:informatique Mots-clés : Reconnaissance de Parole Arabe, outil HTK, Modèle Acoustique, Dépendant du Contexte, Indépendant du Contexte, GMM. Résumé : Dans ce travail de thèse, nous décrivons et proposons une méthode efficace de reconnaissance de la parole arabe continue indépendante du locuteur, basée sur un corpus vocal phonétiquement riche. Ce corpus de parole contient deux ensembles de données : (1) les chiffres arabes parlés (SAD), enregistrés par 66 locuteurs (33 hommes et 33 femmes), prennent 6600 mots de chiffres dans lesquels chaque locuteur prononce chaque chiffre de zéro à neuf dix fois, et (2) : le second ensemble de données est restreint aux phrases coraniques de trois locuteurs célèbres avec les règles de Tajweed (une sorte de chant) des trente derniers chapitres (Sourate) du Saint Coran.
Nous traitons la problématique générale de la reconnaissance de la parole qui est la coarticulation avec les modèles dépendants du contexte : tri-phones comme modèle acoustique, et les bi-grams comme modèle de langage qui était le plus approprié dans ce texte. Nous traitons le problème particulier d'ajustement de la durée de son avec les tri-phones étendus aux modèles de mélanges Gaussiens (GMM).
Le système de reconnaissance de la parole arabe proposé est basé sur l’outil qui manipule les modèles de Markov cachés : HMM Toolkit (HTK) de l’université de Cambridge. Des tests expérimentaux montrent que l'ensemble de données de chiffres utilisant trois états émettant par phonème (son), a un excellent résultat de reconnaissance de mots qui est de 97,95 %. Le taux de reconnaissance des phrases est de 93,14 %.
Le meilleur résultat des versets coraniques obtenus est de 73,44 % de mots reconnus, et de 14,38 % de phrases reconnues. Un taux de 66,09% de précision chez le lecteur « Elmirigli ».
L'adaptation du système de base à la voix d'intonation du lecteur, puis l'application d'un GMM approprié à chaque tri-phone de liste liée, dépasse l'expérience du modèle acoustique HMM-triphone par un taux de mots reconnus de 16,93 % chez le lecteur « Alsudaissi » grâce au problème des voyelles de longue durée (appelée en arabe mudud) résolu.
Notre contribution est d'appliquer des tri-phones étendus aux modèles GMM qui est comparé à la méthode de Régression Linéaire à Ressemblance Maximum (MLLR), et de les dépasser de près de 5 % chez le lecteur « Alsudaissi ».
Exemplaires
Code-barres Cote Support Localisation Section Disponibilité 1502 02-08-463 Version numérique et papier Bibliothèque USTOMB Thèse de Doctorat Exclu du prêt Documents numériques
02-08-463.pdfAdobe Acrobat PDF
BUC USTOMB'Thèses



Service Thèse de la BUC met à votre disposition L'ensemble des thèses de doctorat et mémoires de magister soutenues à l'USTO MB
Adresse
BUC USTOMB'ThèsesBibliothèque centrale USTOMB
BP 1505 EL M'Naouer USTO ORAN
Algérie
(213)041627180
contact