les Thèses Soutenues à l'USTO MB
vous cherchez une thèse?
A partir de cette page vous pouvez :
Retourner au premier écran avec les recherches... | Votre compte |
Détail de l'auteur
Auteur Nebia BENZATER
Documents disponibles écrits par cet auteur



Titre : Analyse Morphologique du Texte Arabe pour Son Indexation Sémantique Type de document : document électronique Auteurs : Nebia BENZATER, Auteur Année de publication : 2015 Importance : 122 p Accompagnement : CD Langues : Français (fre) Catégories : Informatique:Reconnaissance des formes et Intelligence artificielle. Mots-clés : Arabe, Recherche d’Information, Indexation Sémantique, Analyse Morphologique, lemmatisation Résumé : Le traitement automatique de la langue arabe est un domaine très vaste dans le cadre de l’évaluation des méthodes de recherche d’information et du TextMining, il consiste à traiter les niveaux morphologiques, syntaxiques, phonologiques et lexicaux . Avec le peu des travaux dans le domaine, il s’avère primordial de disposer d’outils d’analyse efficaces afin de promouvoir les travaux de recherche en arabe sur le Web. Dans un langage à haute morphologie dérivationnelle telle que l’arabe, la détection des unités lexicales dans un texte électronique n’est guère une tâche triviale. Certaines méthodes de stemming, par simple troncature des affixes ou par extraction des racines plus abstraites, ont été développées et validées pour des tâches classiques de la recherche d’informations (catégorisation, clustering, ordonnancement, …etc.). Toutefois, ces techniques de stemming risquent d’induire une caractérisation ambiguë du texte arabe pour des modèles à base d’indexation sémantique.
Par ailleurs, l’analyse morphologique s’appuie sur des ressources linguistiques combinant un vocabulaire prédéfini, des schémas de construction et des règles strictes de dérivation, cependant, la non-disponibilité libre de telles ressources reste une entrave majeure devant le développement des modèles sémantiques pour le texte arabe.
L’objectif de ce projet est d’élaborer une étude comparative des différentes approches de stemming et d’étudier la faisabilité d’utiliser l’une ou l’autre pour les modèles d’indexation sémantique des textes arabes. Il s’agit aussi de développer un analyseur morphologique pour l’extraction des racines et des lemmes arabes et de l’évaluer sur des corpus textuels réels.
Automatic analysis of Arabic text is an essential step in information retrieval; it is based on several methods of morphological analysis, among them: stemming methods and morphological analysis based dictionaries methods. In this work we develop a new Arabic morphological analyzer based on dictionaries by adding a large numbers of prefixes and suffixes. We attempt to extract the accuracy semantic roots, stems, lexemes and lemmas of Arabic words. This method is compared with four different stemming approaches: Light stemming of Larkey which truncates a word by simple rules, Khoja analyzer, Arabic Stemming without a root dictionary and Light stemming ANEA : a new enhanced approachDirecteur de thèse : BENYETTOU,Abdelkader Analyse Morphologique du Texte Arabe pour Son Indexation Sémantique [document électronique] / Nebia BENZATER, Auteur . - 2015 . - 122 p + CD.
Langues : Français (fre)
Catégories : Informatique:Reconnaissance des formes et Intelligence artificielle. Mots-clés : Arabe, Recherche d’Information, Indexation Sémantique, Analyse Morphologique, lemmatisation Résumé : Le traitement automatique de la langue arabe est un domaine très vaste dans le cadre de l’évaluation des méthodes de recherche d’information et du TextMining, il consiste à traiter les niveaux morphologiques, syntaxiques, phonologiques et lexicaux . Avec le peu des travaux dans le domaine, il s’avère primordial de disposer d’outils d’analyse efficaces afin de promouvoir les travaux de recherche en arabe sur le Web. Dans un langage à haute morphologie dérivationnelle telle que l’arabe, la détection des unités lexicales dans un texte électronique n’est guère une tâche triviale. Certaines méthodes de stemming, par simple troncature des affixes ou par extraction des racines plus abstraites, ont été développées et validées pour des tâches classiques de la recherche d’informations (catégorisation, clustering, ordonnancement, …etc.). Toutefois, ces techniques de stemming risquent d’induire une caractérisation ambiguë du texte arabe pour des modèles à base d’indexation sémantique.
Par ailleurs, l’analyse morphologique s’appuie sur des ressources linguistiques combinant un vocabulaire prédéfini, des schémas de construction et des règles strictes de dérivation, cependant, la non-disponibilité libre de telles ressources reste une entrave majeure devant le développement des modèles sémantiques pour le texte arabe.
L’objectif de ce projet est d’élaborer une étude comparative des différentes approches de stemming et d’étudier la faisabilité d’utiliser l’une ou l’autre pour les modèles d’indexation sémantique des textes arabes. Il s’agit aussi de développer un analyseur morphologique pour l’extraction des racines et des lemmes arabes et de l’évaluer sur des corpus textuels réels.
Automatic analysis of Arabic text is an essential step in information retrieval; it is based on several methods of morphological analysis, among them: stemming methods and morphological analysis based dictionaries methods. In this work we develop a new Arabic morphological analyzer based on dictionaries by adding a large numbers of prefixes and suffixes. We attempt to extract the accuracy semantic roots, stems, lexemes and lemmas of Arabic words. This method is compared with four different stemming approaches: Light stemming of Larkey which truncates a word by simple rules, Khoja analyzer, Arabic Stemming without a root dictionary and Light stemming ANEA : a new enhanced approachDirecteur de thèse : BENYETTOU,Abdelkader Exemplaires
Code-barres Cote Support Localisation Section Disponibilité 4530 02-08-370 Version numérique et papier Bibliothèque USTOMB Mémoire de Magister Exclu du prêt Documents numériques
Analyse Morphologique du Texte Arabe pour Son Indexation SémantiqueAdobe Acrobat PDF
BUC USTOMB'Thèses



Service Thèse de la BUC met à votre disposition L'ensemble des thèses de doctorat et mémoires de magister soutenues à l'USTO MB
Adresse
BUC USTOMB'ThèsesBibliothèque centrale USTOMB
BP 1505 EL M'Naouer USTO ORAN
Algérie
(213)041627180
contact