dnoise

dnoise — Réduit le bruit dans un fichier.

Description

C'est un schéma de réduction de bruit au moyen du seuillage de bruit dans le domaine fréquentiel.

Syntaxe

dnoise [options] -i ficref_bruit -o ficson_sortie ficson_entree

Initialisation

Options spécifiques à dnoise :

  • (pas d'option) fichier son en entrée à débruiter

  • -i nomfic fichier de référence du bruit en entrée

  • -o nomfic fichier son de sortie

  • -N fnum nombre de filtres passe-bande (par défaut : 1024)

  • -w fovlp facteur de chevauchement des filtres : {0,1,(2),3} NE PAS UTILISER -w ET -M

  • -M longfa longueur de la fenêtre d'analyse (par défaut : N-1 à moins que -w ne soit spécifié)

  • -L longfs longueur de la fenêtre de synthèse (par défaut : M)

  • -D factd facteur de décimation (par défaut : M/8)

  • -b datedeb date de début dans le fichier de référence du bruit (par défaut : 0)

  • -B smpdeb échantillon de départ dans le fichier de référence du bruit (par défaut : 0)

  • -e datefin date de fin dans le fichier de référence du bruit (par défaut : fin du fichier)

  • -E smpfin échantillon de fin dans le fichier de référence du bruit (par défaut : fin du fichier)

  • -t seuil seuil au-dessus du bruit de référence en dB (par défaut : 30)

  • -S gfact raideur de la coupure au seuil de bruit, intervalle : 1 à 5 (par défaut : 1)

  • -n nbrtrm nombre de trames de TFR sur lesquelles calculer la moyenne (par défaut : 5)

  • -m gainmin gain minimum du seuillage de bruit lorsqu'il est fermé (par défaut : -40)

Options de format du fichier son :

  • -A format de sortie AIFF

  • -W format de sortie WAV

  • -J format de sortie IRCAM

  • -h pas d'en-tête de fichier (non valide pour une sortie AIFF/WAV)

  • -8 échantillons en caractères non signés sur 8 bit

  • -c échantillons en caractères signés sur 8 bit

  • -a échantillons en alaw

  • -u échantillons en ulaw

  • -s échantillons en entiers courts

  • -l échantillons en entiers longs

  • -f échantillons en virgule flottante. Les nombres en virgule flottante sont aussi supportés par les fichiers WAV. (Nouveau dans Csound 3.47.)

Options supplémentaires :

  • -R verbose - impression d'une information d'état

  • -H [N] imprime un caractère de type pulsation à chaque écriture dans le fichier son.

  • -- nomfic sortie de journal dans le fichier nomfic

  • -V verbose - impression d'une information d'état

[Note] Note

DNOISE consulte aussi la variable d'environnement SFOUTYP pour déterminer le format du fichier de sortie.

L'option -i est utilisée pour un fichier de référence du bruit (créé normalement à partir d'un court extrait du fichier à débruiter, dans lequel seul le bruit est audible). Le fichier son d'entrée à débruiter peut être donné n'importe où dans la ligne de commande, sans drapeau.

Exécution

C'est un schéma de réduction de bruit au moyen du seuillage de bruit dans le domaine fréquentiel. Il fonctionnera mieux dans le cas d'un rapport signal/bruit élevé avec un bruit de type souffle.

L'algorithme est celui suggéré par Moorer & Berger dans « Linear-Phase Bandsplitting: Theory and Applications » presenté à la 76ème Convention, 8-11 Octobre 1984 à New York, de l'Audio Engineering Society (préimpression #2132) sauf qu'il utilise la formulation par Chevauchement-Addition Pondéré pour l'analyse et la synthèse de Fourier à court terme au lieu de la formulation récursive proposée par Moorer & Berger. Le gain pour chaque bin de fréquence est calculé indépendamment selon la formule

gain = g0 + (1-g0) * [moy / (moy + th*th*nref)] ^ sh

moy et nref sont la moyenne quadratique du signal et du bruit respectivement pour le bin en question. (Ceci diffère légèrement de la version dans Moorer & Berger.)

Les paramètres critiques th et g0 sont spécifiés en dB et convertis en interne en valeurs décimales. Les valeurs nref sont calculées au début du programme sur la base d'un fichier de bruit (spécifié dans la ligne de commande) qui contient du bruit sans signal.

Les valeurs moy sont calculée sur une fenêtre rectangulaire de m trames de TFR centrée sur la date courante. Cela correspond à une extension temporelle de m*D/R (qui vaut typiquement (m*N/8)/R ). Le réglage par défaut de N, m, et D devrait convenir pour la plupart des utilisations. Un taux d'échantillonnage supérieur à 16 kHz pourrait signifier un N plus grand.

Crédits

Auteur : Mark Dolson

26 août 1989

Auteur : John ffitch

30 décembre 2000

Mis à jour par Rasmus Ekman le 11 mars 2002.