Tous les articles

Comment ameliorer la qualite audio pour la transcription : guide complet

·15 min de lecture

La qualite de l'enregistrement audio est le facteur le plus determinant pour la precision d'une transcription. Meme les modeles de reconnaissance vocale les plus avances, y compris OpenAI Whisper, produisent des resultats nettement inferieurs sur des enregistrements bruyants, trop faibles ou deformes. Ce guide presente des etapes concretes pour enregistrer un son propre et preparer vos fichiers pour la transcription.


Pourquoi la qualite audio est essentielle

Le lien entre la qualite d'enregistrement et la precision de transcription est direct et mesurable. La metrique standard de l'industrie est le WER (Word Error Rate) — le pourcentage de mots incorrectement reconnus.

Valeurs WER typiques :

La difference entre 5 % et 25 % de WER, c'est la difference entre "copier et utiliser" et "passer une heure sur des corrections manuelles". Investir 10 minutes dans la preparation de l'enregistrement vous fait gagner des heures d'edition.


Comment enregistrer un son propre

Choix du microphone

Le microphone integre de votre ordinateur portable est la pire option pour la transcription. Il capte tous les sons de la piece : clavier, ventilateurs, bruits de la rue. Meme un microphone externe bon marche produira des resultats radicalement meilleurs.

Microphones USB (pour l'enregistrement au bureau) :

Microphones-cravates (pour interviews et conversations) :

Pour les reunions et enregistrements de groupe :

Regles d'enregistrement

Meme avec un excellent microphone, on peut obtenir un mauvais enregistrement si on ignore les regles de base.

Choix de la piece :

Distance au microphone :

Niveaux sonores :

Format d'enregistrement :

Enregistrer des reunions et des appels

Reunions en presentiel :

Enregistrer depuis Zoom/Teams/Google Meet :

Enregistrer des appels telephoniques :


Traitement audio avant transcription

Si l'enregistrement est deja fait et que la qualite n'est pas ideale, tout n'est pas perdu. Un traitement basique peut ameliorer significativement les resultats de la transcription.

Reduction du bruit

Audacity (gratuit, Windows/Mac/Linux) :

Audacity est l'editeur audio gratuit le plus populaire. Voici un guide etape par etape pour la reduction du bruit :

  1. Ouvrez votre fichier dans Audacity
  2. Trouvez une section ou personne ne parle mais ou le bruit de fond est audible (au moins 1-2 secondes)
  3. Selectionnez cette section avec la souris
  4. Menu : Effets → Reduction du bruit → "Prendre le profil du bruit"
  5. Selectionnez l'ensemble de l'enregistrement (Ctrl+A / Cmd+A)
  6. Menu : Effets → Reduction du bruit → ajustez les parametres :
    • Reduction du bruit : 12-18 dB (commencez a 12, augmentez si le bruit persiste)
    • Sensibilite : 6-8
    • Lissage frequentiel : 3-6
  7. Cliquez sur "Previsualiser" pour verifier, puis "OK"

Adobe Podcast Enhance (outil en ligne gratuit) :

Adobe propose un outil gratuit d'amelioration vocale sur podcast.adobe.com/enhance. Telechargez votre fichier — l'IA supprime automatiquement le bruit, ameliore la nettete de la voix et normalise le volume. Limite : fichiers jusqu'a 1 heure. Les resultats sont impressionnants — souvent meilleurs que le traitement manuel.

FFmpeg (ligne de commande) :

Pour ceux qui preferent l'automatisation, FFmpeg offre des filtres puissants. Le filtre afftdn fournit une reduction de bruit adaptative basee sur la FFT. Pour une suppression de bruit plus agressive, augmentez le parametre de reduction a 30-40. Le filtre silenceremove aide a supprimer les longues pauses, ce qui economise aussi du temps de traitement.

Normalisation du volume

La normalisation equilibre le volume de l'enregistrement — les passages faibles deviennent plus forts, les pics sont lisses.

Pourquoi c'est important :

Comment faire dans Audacity :

  1. Ouvrez votre fichier
  2. Selectionnez l'ensemble de l'enregistrement (Ctrl+A / Cmd+A)
  3. Menu : Effets → Normaliser
  4. Definissez l'amplitude de crete a : -1,0 dB
  5. Cliquez sur "OK"

Pour une normalisation plus poussee, utilisez le Compresseur (Effets → Compresseur) — il equalise la difference entre les passages faibles et forts sans ecreter les pics.

Conversion de format

Il existe un format audio optimal pour la transcription. Diktovka convertit automatiquement les fichiers envoyes, mais si vous traitez manuellement, voici les parametres ideaux :

Parametres optimaux pour la transcription :

Pourquoi le mono est preferable au stereo :

Dans Audacity : Pistes → Mix → Mixer stereo vers mono. Puis : Projet → Frequence → 16000 Hz. Exporter : Fichier → Exporter → WAV 16-bit.


Problemes courants et solutions

ProblemeCauseSolution
Bruit de fond (bourdonnement, souffle)Climatisation, electronique, circulationReduction de bruit dans Audacity ou Adobe Enhance
Echo et reverberationPiece vide, murs nusFiltre de-reverb ; pour les prochains enregistrements, utiliser une piece meublee
Voix faibleTrop loin du microphoneNormalisation ; lors de l'enregistrement, se rapprocher du micro
Locuteurs superposesPersonnes parlant simultanementNe peut pas etre entierement corrige, mais la diarisation dans Diktovka aide a separer les locuteurs
Musique de fondRadio, musique d'ambianceOutils d'isolation vocale (UVR5, Demucs) ; meilleure solution : eteindre la musique pendant l'enregistrement
Pops et clicsTrop pres du micro, pas de filtre anti-popFiltre de-click dans Audacity ; utiliser un filtre anti-pop ou incliner le micro a 45 degres
Distorsion (clipping)Surcharge du microphoneNon reparable apres coup ; baisser le niveau d'entree avant l'enregistrement
Qualite telephoniqueCodec vocal compresseNormalisation + reduction de bruit legere ; utiliser la VoIP quand c'est possible

Diktovka optimise votre audio automatiquement

La plateforme Diktovka effectue automatiquement les etapes cles de preparation lors du telechargement d'un fichier :

La plateforme gere meme les enregistrements imparfaits — appels telephoniques, enregistrements de reunions bruyantes, messages vocaux. Mais plus la qualite source est elevee, plus le resultat est precis. Investir 10 minutes de preparation donne une transcription sensiblement plus fidele.


Checklist avant l'enregistrement

Imprimez-la ou sauvegardez-la — a verifier avant chaque enregistrement important :

  1. Microphone branche et selectionne comme peripherique d'entree dans les parametres systeme
  2. Enregistrement test effectue — ecoutez 10 secondes, verifiez que le son est propre
  3. Piece calme — fenetres fermees, appareils bruyants eteints
  4. Distance au microphone — 15-30 cm (ou cravate a 15-20 cm de la bouche)
  5. Niveau d'enregistrement — cretes entre -12 et -6 dB, hors de la zone rouge
  6. Format d'enregistrement — WAV ou FLAC (pas MP3 128 kbps)
  7. Espace disque suffisant — le WAV consomme environ 10 Mo/min
  8. Demander aux participants de ne pas s'interrompre et de parler clairement
  9. Filtre anti-pop en place (pour les microphones de bureau)
  10. Enregistrement lance — cela semble evident, mais c'est oublie plus souvent qu'on ne le pense

Conclusion

Ameliorer la qualite audio pour la transcription n'est pas sorcier. Un microphone correct pour 25-110 EUR, une piece calme et de bons reglages d'enregistrement fournissent 80 % du resultat. Les 20 % restants sont du post-traitement dans Audacity ou Adobe Enhance.

Envoyez votre audio prepare sur Diktovka — et obtenez une transcription qui n'a presque pas besoin de retouche.

FAQ

Quel microphone est le mieux adapté à la transcription ?

Pour l'enregistrement au bureau, un microphone USB est optimal : le Fifine K669 (~25 EUR) en entrée de gamme ou le Blue Yeti (~110 EUR) pour une qualité maximale. Pour les interviews, un micro-cravate Boya BY-M1 (~15 EUR). Pour les réunions, un haut-parleur de conférence Jabra Speak 510. Même un microphone externe bon marché est nettement meilleur que le micro intégré d'un ordinateur portable.

Comment supprimer le bruit d'un enregistrement audio avant la transcription ?

Dans Audacity (gratuit) : repérez un passage silencieux avec du bruit de fond, sélectionnez-le, appliquez « Obtenir le profil de bruit », puis sélectionnez tout l'enregistrement et lancez « Réduction de bruit » (12-18 dB). Plus simple : Adobe Podcast Enhance (outil en ligne gratuit) nettoie automatiquement le son grâce à l'IA.

Quelle qualité audio minimale faut-il pour une bonne transcription ?

Pour un WER de 5-8 % (édition minimale), un enregistrement dans une pièce calme avec un microphone externe à 15-30 cm suffit. Format : WAV ou MP3 320 kbps. Avec des enregistrements bruités, le WER monte à 15-25 %, et en mauvaise qualité (écho, voix basse) à 25-40 %, nécessitant une correction manuelle importante.

Quel format audio est le meilleur pour la transcription ?

Paramètres optimaux : mono, 16 kHz, 16-bit WAV. Le mono est préférable au stéréo : les modèles de reconnaissance vocale travaillent en mono, la voix ressort davantage par rapport au bruit de fond, et le fichier est deux fois plus léger. Évitez le MP3 128 kbps et en dessous en raison de la perte de qualité perceptible.

Comment améliorer un enregistrement avec FFmpeg ?

FFmpeg propose le filtre afftdn pour la réduction de bruit adaptative basée sur la FFT. Pour une réduction plus agressive, augmentez le paramètre noise reduction à 30-40. Le filtre silenceremove supprime les longues pauses, ce qui économise du temps de traitement. Pour la conversion au format optimal : mono, 16 kHz, 16-bit.