Méthodes statistiques pour la compréhension automatique de la parole

Salma Jamoussi

Thèse Année : 2004

Méthodes statistiques pour la compréhension automatique de la parole

(1)

Salma Jamoussi

Fonction : Auteur
PersonId : 757079
IdRef : 083230785

Laboratoire Lorrain de Recherche en Informatique et ses Applications

Résumé

The work presented in this manuscript aims to carry out an understanding system for the spontaneous speech. We are interested in specific domain systems that concern the oral interrogation of data bases. Our work is based on statistical approach which considers the understanding problem as a translation process between words and semantic concepts. The idea we defend in this thesis is the possibility to obtain significant semantic concepts using clustering methods. We start by defining some semantic measures to quantify the semantic relations between words. Then, we use triggers to build up concepts in an automatic way. In order to improve we test two well known methods : the K-means algorithm and the Kohonen maps. We also propose the use of the Oja and Sanger neural networks. The latter proved to be ineffective in our case. Lastly, we use a Bayesian network conceived for clustering and called AutoClass. AutoClass provides clear and significant concepts.

Le travail présenté dans ce manuscrit vise à réaliser un système de compréhension de la parole spontanée spécifique à un domaine. Nous nous intéressons plus particulièrement à l'interrogation orale de bases de données. Dans notre travail, nous nous sommes basés sur une approche statistique qui considère que la compréhension est un processus de traduction de la parole en des concepts sémantiques. L'idée que nous défendons est qu'il est possible d'obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous testons quelques méthodes de partionnement : l'algorithme des K-means et les cartes de Kohonen. Nous proposons également l'utilisation des réseaux neuronaux de Oja et Sanger. Enfin, nous utilisons le réseau bayésien AutoClass conçu pour la classification non supervisée et qui nous a fourni des concepts significatifs.

Mots clés

Reconnaissance automatique de la parole-Méthodes statistiques Analyse du discours-Méthodes statistiques Langage naturel Traitement du (informatique) Classification automatique (statistique) Statistique bayésienne

Domaines

Autre [cs.OH]

Thèses UL : Connectez-vous pour contacter le contributeur

https://hal.univ-lorraine.fr/tel-01746760

Soumis le : jeudi 29 mars 2018-10:44:20

Dernière modification le : lundi 11 septembre 2023-17:41:19

Dates et versions

tel-01746760 , version 1 (29-03-2018)

Identifiants

HAL Id : tel-01746760 , version 1

Citer

Salma Jamoussi. Méthodes statistiques pour la compréhension automatique de la parole. Autre [cs.OH]. Université Henri Poincaré - Nancy 1, 2004. Français. ⟨NNT : 2004NAN10170⟩. ⟨tel-01746760⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE LORIA THESES-UL

83 Consultations

0 Téléchargements

Méthodes statistiques pour la compréhension automatique de la parole

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Lien texte intégral

Citer

Exporter

Collections

Partager