Narrow your search

Library

ULiège (1)


Resource type

dissertation (1)


Language

French (1)


Year
From To Submit

2021 (1)

Listing 1 - 1 of 1
Sort by

Dissertation
Dans quelle mesure la complexité physique en hautes fréquences de modèles de synthèse de la parole différents impacte-t-elle la perception de phonèmes ?
Authors: --- --- --- ---
Year: 2021 Publisher: Liège Université de Liège (ULiège)

Loading...
Export citation

Choose an application

Bookmark

Abstract

Les hautes fréquences (HF) de la parole (> 5 kHz) ont été ignorées dans la majorité des recherches jusque dans les années 2010, au profit de l’étude de l’énergie en basse fréquence (< 5 kHz) considérée comme suffisante pour l’intelligibilité de la parole (Boyd-Pratt & Donai, 2020 ; Monson & Caravello, 2019 ; Vitela et al., 2015). Jusqu’alors, aucune étude n’était pourtant parvenue à démontrer l’inutilité perceptive des HF (Monson, Hunter et al., 2014). La recherche de Birkholz et Drechsel (2021) a d’ailleurs suggéré leur potentiel rôle pour produire un signal de parole plus naturel. Ce mémoire s’inscrit dans un projet de développement d’une synthèse articulatoire à large bande à partir de deux types de modélisation physique des hautes fréquences : la modélisation unidimensionnelle (1D) et la modélisation tridimensionnelle (3D). Il vise à mieux comprendre et définir le lien entre la perception de la parole et les aspects physiques et acoustiques liés à sa production dans l’entièreté du registre fréquentiel audible (0.02 à 20 kHz). Une sensibilité auditive chez de jeunes adultes entre les modèles 1D et 3D pour la synthèse des HF devrait être objectivée. En outre, les stimuli générés avec le modèle 3D devraient être considérés comme plus naturels que ceux générés avec le modèle 1D, compte-tenu sa description plus complète des effets de la géométrie tridimensionnelle du tractus vocal sur ses propriétés acoustiques (Arnela et al., 2019).&#13;Après avoir complété un questionnaire anamnestique et réalisé une audiométrie tonale, 31 juges ont réalisé deux tâches perceptives. Une première tâche de discrimination de paires de stimuli a été proposée, au sein de laquelle les juges devaient indiquer si la paire était identique ou différente. La seconde tâche expérimentale consistait à évaluer l’aspect naturel de phonèmes sur une échelle de Likert allant de 0 « pas du tout naturel » à 3 « totalement naturel ». Ces expériences nous ont permis de répondre à plusieurs hypothèses concernant la modélisation utilisée, le genre de la voix de synthèse, le type de phonème et les fiabilités intra- et inter-juges.&#13;Un effet significatif concernant la perception de différences entre les modèles physiques 1D et 3D, avec une capacité de discrimination plus faible pour les paires 1D-3D, a été relevé au sein de la première tâche expérimentale. Aucun effet significatif concernant le modèle utilisé n’a pu être montré pour la seconde tâche, au sein de laquelle les stimuli 1D et 3D ont été considérés avec un degré de naturel similaire. En outre, peu importe la modélisation employée, nous avons constaté que l’aspect naturel dépend du phonème. Cette étude reste exploratoire dans la définition du rôle des HF pour la perception de la parole selon des modélisations physiques différentes. Des études confirmatoires sont donc nécessaires.

Listing 1 - 1 of 1
Sort by