Article

Speech Pre-Processing for Pitch and Pitch-Cylce Evolutions Smoothing

Authors:
To read the full-text of this research, you can request a copy directly from the author.

Abstract

In low bit rate speech coders, pitch is usually transmitted once per frame and, when needed, the intermediate pitch values are obtained by interpolation between 2 adjacent pitch values. Although pitch usually evolves slowly, sometimes it has irregular variations and the estimated pitch differs from the real one. In addition, some speech coders, e.g., waveform interpolation coders, rely on smooth pitch- cycle evolutions to extract speech model parameters in the analysis stage. However, non-stationary characteristics of speech may lead to inaccurate estimation of the parameters. This affects the synthesised speech quality. We propose a pre-processor, which modifies the residual speech signal to provide smooth pitch vari- ations and pitch-cycle evolutions, without distorting perceptual speech quality. Thus, the pitch and the voicing level can be more accurately determined.

No full-text available

Request Full-text Paper PDF

To read the full-text of this research,
you can request a copy directly from the author.

... Dans certains domaines d'application tels que : la parole, l'imagerie biomédicale, la géophysique, la cristallographie à rayon X,…etc., [Harasty88], [Raita94], [Rosten03], [Farsi06], [Willson94], [Djokic98], [Kurosu03]. ...
Thesis
Full-text available
Le travail effectué dans le cadre de cette thèse consiste à étudier et élaborer de nouvelles techniques d’implémentation en temps réel de certaine classe particulière de systèmes, appelés filtres récursifs non causaux à phase nulle (PN). Ces filtres sont souvent utilisés en temps différé (off line). Ils s’implémentent avec des cellules élémentaires récursives, et nécessitent deux inversions temporelles. Ainsi, leur mise en œuvre se réalise par deux filtrages : l’un est causal et s’exécute dans le sens direct (forward filtering), l’autre est non causal, s’effectuant avec une entrée inversée (backward filtering). Ils sont appréciés pour leurs performances intéressantes et non conflictuelles en amplitude et en phase. Ils peuvent avoir à une phase exactement nulle avec une caractéristique d’amplitude très sélective et similaire à celle d’un filtre optimal elliptique. Ils présentent une bonne alternative par rapport aux filtres classiques RII à phase quasi-linéaire et RIF à phase linéaire. Cependant, leur mise en œuvre en temps réel est délicate ; et rend leur utilisation peu intéressante pour le traitement des signaux de longueur importante. Il existe dans la littérature scientifique, quelques techniques de leur implémentation en temps réel. Celles-ci se basent, pour la plupart, sur des approches utilisant un sectionnement du signal traité. Ceci engendre des erreurs de calcul souvent importantes, avec des retards purs conséquents et qui exigent plus de ressources en mémoire. Notre contribution dans cette thèse portera sur une synthèse critique et une étude de performances des principales techniques de mise en œuvre des filtres PN en temps réel, à savoir : le sectionnement avec chevauchement sauvegardé (SCSauve), et chevauchement additionné (SCAdd), ou sans chevauchement (SSC). Les performances sont évaluées selon quatre critères : l’erreur de calcul, le retard pur engendré, la quantité de mémoire requise et la complexité algorithmique exigée. Une définition des différentes erreurs de calcul dues à la réalisation des filtres PN en temps réel est abordée. Une approche analytique est aussi élaborée dans le but de caractériser l’origine de ces erreurs de calcul. L’impact de sectionnement sur la qualité de la réponse d’un filtre PN est évalué dans les deux domaines temporel et fréquentiel, respectivement par la notion de l’erreur de sectionnement relative et le taux de distorsion harmonique (THD). Une nouvelle technique s’appuie sur le sectionnement sans chevauchement est proposée. Elle se base sur un calcul récursif de l’état initial du filtrage non causal. Une pile de type FIFO (First In, First Out) est intégrée afin d’organiser les échantillons d’entrées. Les inversions temporelles sont implémentées par des piles de type LIFO (First Out, First In). La technique proposée offre une diminution de la complexité algorithmique et de la quantité de mémoire requise, avec une réduction du retard pur pour des erreurs de calcul acceptables. Mots Clés : phase nulle - phase linéaire - filtre RII - filtres RIF - filtre PN - sectionnement par chevauchement sauvegardé - sectionnement par chevauchement additionné - sectionnement sans chevauchement - complexité algorithmique – retard pur- FIFO- LIFO
... This class of filters has high performance in magnitude using, for example, an elliptic digital filter design and a linear phase [4]. These high performances are strongly required in some special cases of noise suppression filtering where the signal-to-noise ratio (SNR) is very low, such as in speech parameter estimation in a high-pass band [8][9][10][11]; for extracting weak auditory evoked potentials from spontaneous electroencephalogram signals [12]; or for filtering high-frequency noise from noisy electrocardiogram (ECG) signals [5,13]. The computational advantages of noncausal IIR filters over causal IIR or finite impulse response (FIR) filters are clearly indicated in [2,4,5]. ...
Article
Full-text available
A novel method for implementing noncausal forward/backward 2-pass recursive digital filters in real time is presented. It is based on a segment-wise block processing scheme without overlapping. Factors that degrade the linearity of the overall system's transfer function are discussed. An analytical condition that corrects the system's linearity is elaborated upon using the state variable approach. A recursive algorithm is developed to compute an implementable condition for real-time filtering. A single first in, first out queue memory is introduced to ensure an organized and continuous data stream into the proposed system. This technique allows real-time, sample-by-sample filtering, and it yields reduced delay and data storage memory compared to previous works. Better performances in total harmonic distortion were also obtained. Experimental results are illustrated.
ResearchGate has not been able to resolve any references for this publication.