Tous les articles

Transcription audio : applications et outils

·18 min de lecture

Tour d'horizon complet des applications et outils de transcription vocale : GUI de bureau basées sur Whisper, solutions self-hosted, éditeurs vidéo avec transcription intégrée, services en ligne et applications mobiles pour iOS et Android. Toutes les options — des solutions open-source entièrement gratuites aux solutions payantes avec des fonctionnalités avancées.


Applications de bureau : Whisper à visage humain

Pour ceux qui ont besoin d'une interface graphique simple sans ligne de commande, tout un écosystème d'applications de bureau basées sur Whisper s'est développé. Elles fonctionnent toutes hors ligne, les données ne quittent pas l'ordinateur — en savoir plus dans «Transcription locale vs cloud».

Handy (handy.computer) — application gratuite open-source pour macOS/Windows/Linux avec une approche unique : dictée push-to-talk directement dans n'importe quel champ de texte. Appuyez sur le raccourci → parlez → relâchez → le texte est inséré dans la fenêtre active. Idéal pour remplacer le clavier lors de la saisie de texte, de la messagerie et de la prise de notes. Construite sur Whisper, entièrement hors ligne et privée. Sponsorisée par Wordcab et Bolt AI.

Vibe (thewh1teagle.github.io/vibe) — l'une des meilleures solutions gratuites open-source, plus de 5 000 étoiles sur GitHub. Multiplateforme (Windows, macOS, Linux), construite avec Tauri + whisper.cpp. Prend en charge l'accélération GPU (NVIDIA, AMD, Apple Silicon via Vulkan/CoreML), plus de 90 langues, la diarisation des locuteurs, l'export en SRT/VTT/TXT/DOCX/PDF/JSON, la transcription de liens YouTube via yt-dlp, l'enregistrement au microphone, le résumé via Claude/Ollama, une API HTTP avec documentation Swagger et même un mode CLI. Le client de bureau gratuit le plus complet à ce jour. Installateur ~24 Mo, après installation ~87 Mo + modèle.

Buzz (buzzcaptions.com) — GUI gratuite open-source pour Whisper. Multiplateforme, prend en charge plusieurs backends (whisper.cpp, faster-whisper), séparation des locuteurs, export de sous-titres. Plus minimaliste que Vibe, mais stable et éprouvé.

MacWhisper / Whisper Transcription (App Store, macupdate.com) — application native macOS. La version gratuite inclut les modèles Base et Small. Abonnement Pro : 4,99 $/sem, 8,99 $/mois, 29,99 $/an, ou 79,99 $ à vie. Pro débloque les modèles Medium et Large, le traitement par lots, l'enregistrement de l'audio système (appels Zoom, podcasts), la séparation des locuteurs, le Reader Mode, l'intégration ChatGPT pour le résumé. L'interface Whisper la plus soignée pour Mac. Note ~4.0 sur MacUpdate.

Whisper Notes (whispernotes.app) — 6,99 $ en paiement unique pour iOS + Mac. Plus de 60 000 utilisateurs. Fonctionnalité clé — dictée à l'échelle du système : maintenez Fn dans n'importe quelle application → parlez → relâchez → le texte est inséré. Import de fichiers audio/vidéo avec résultat en streaming. Entièrement hors ligne, utilise Whisper Large V3 Turbo sur Apple Silicon.

WhisperDesktop (github.com/Const-me/Whisper) — application gratuite pour Windows avec accélération GPU via DirectCompute/GPGPU. Nettement plus rapide que le Whisper original : 3:24 min d'audio en 19 secondes sur GeForce 1080Ti (contre 45 sec avec PyTorch+CUDA). Transcription de fichiers + enregistrement au microphone en temps réel. Modèle recommandé : ggml-medium.bin (~1,42 Go).

WhisperUI (Microsoft Store) — application gratuite pour Windows. Accélération GPU via CPU, OpenCL, NVIDIA CUDA 11/12. Entièrement hors ligne, export de sous-titres en SRT/VTT, traitement par lots.

Aiko (~5,99 $, iOS/Mac) — l'application Whisper la plus simple pour Apple. Glissez-déposez un fichier audio → texte. 100 % sur l'appareil, idéal pour ceux qui veulent une transcription en un clic sans configuration.

Whisper Transcription (iOS App Store, freemium) — application mobile avec mode sur l'appareil et en cloud. L'extension Share permet de transcrire les messages vocaux d'iMessage, WhatsApp, Voice Memos. Nécessite iPhone 13+ pour le mode sur l'appareil. Résumé par IA, chat avec la transcription. Note 4.6+.


Solutions self-hosted : pour votre propre serveur

Pour ceux qui veulent déployer un service de transcription complet sur leur propre serveur ou réseau local.

Whishper (github.com/pluja/whishper) — plateforme self-hosted complète avec interface web. Inclut faster-whisper pour la transcription, LibreTranslate/Argos Translate pour la traduction de sous-titres (plus de 60 langues), éditeur de sous-titres intégré, export en JSON/TXT/VTT/SRT. Se déploie via Docker Compose (5 conteneurs : API, backend, frontend, traduction, MongoDB). 100 % hors ligne après installation. Excellent choix pour les équipes qui ont besoin d'un service privé sans cloud.

WhisperLive (github.com/collabora/WhisperLive, Collabora) — solution open-source pour la transcription en temps réel. Serveur WebSocket : connectez le microphone ou un fichier → recevez le texte avec une latence minimale. Prend en charge les backends faster-whisper, TensorRT et OpenVINO. Client Python et démo JS. Adapté à la transcription en direct de réunions et conférences.

WhisperTranscribe (whispertranscribe.com) — service cloud avec application de bureau pour Windows. Essai gratuit de 60 minutes sans carte bancaire. Utilise Whisper + AssemblyAI. En plus de la transcription : plus de 57 types de contenu à partir d'un seul enregistrement (publications, résumés, supports marketing), entraînement IA au style de l'utilisateur, transcription YouTube/Vimeo par lien, podcasts depuis une bibliothèque de 2,5 millions. Plus de 55 langues. Abonnement ~15 $/mois.


Éditeurs vidéo avec transcription intégrée

Une catégorie à part — les éditeurs vidéo qui savent transcrire l'audio dans le cadre de leur workflow.

CapCut (ByteDance/TikTok) — éditeur vidéo gratuit avec une puissante fonction Auto Captions. Prend en charge plus de 100 langues, dont le français. Transcrit la parole en sous-titres, permet d'éditer la vidéo à partir du texte (transcript-based editing), de traduire les sous-titres, de créer des sous-titres bilingues. Version web, bureau (Windows/Mac), applications mobiles. Gratuit. Limitation : orienté vers les sous-titres, pas vers les documents de transcription complets.

Descript — puissant éditeur audio/vidéo avec transcript-based editing (supprimez un mot du texte → il est coupé de la vidéo). Ne prend pas en charge le russe — uniquement les caractères latins. Mentionné par souci d'exhaustivité.

DaVinci Resolve (Blackmagic Design) — éditeur vidéo professionnel avec transcription intégrée via Whisper. Prend en charge plusieurs langues, mais la qualité est inférieure à celle des outils spécialisés. Version gratuite disponible. Transcription dans la timeline pour le text-based editing.

Subtitle Edit (nikse.dk) — éditeur de sous-titres gratuit open-source pour Windows (partiellement Linux) avec transcription intégrée via Whisper. Prend en charge plus de 7 moteurs Whisper (OpenAI Whisper, Purfview's Faster-Whisper-XXL, CPP, CPP cuBLAS, Const-me, CTranslate2, stable-ts, WhisperX), traitement par lots, traduction automatique, plus de 100 langues. L'outil gratuit le plus puissant pour créer des sous-titres à partir de l'audio. Avec RTX A6000 — 2 heures en quelques minutes.

Subper / SubtitleWhisper (subtitlewhisper.com) — générateur de sous-titres en ligne basé sur Whisper + Silero VAD. Éditeur de sous-titres en ligne. Plan gratuit limité, payant à partir de 9,99 $/mois. Intégration GPT pour la ponctuation et le découpage en paragraphes.


Extensions de navigateur et outils en ligne

Transkriptor — application web + extension pour Chrome/Firefox + iOS/Android. Prend en charge plusieurs langues, diarisation automatique, export en TXT/SRT/DOCX. Essai gratuit, puis 9,99–30 $/mois. Revendique 99 % de précision.

TurboScribe (turboscribe.ai) — service web avec 3 transcriptions gratuites par jour (jusqu'à 30 min chacune). Plans payants à partir de ~10 $/mois. Whisper sous le capot.

Wonderscribe — service web entièrement gratuit, mais avec un taux d'erreur plus élevé (~16 % WER). Pour les brouillons de transcription.

HuggingFace Spaces (huggingface.co/spaces/openai/whisper) — démo gratuite de Whisper par OpenAI. Chargez un fichier → recevez le texte. Gratuit, mais avec des limitations et des files d'attente.


Applications mobiles

iOS

ApplicationPrixHors ligneFonctionnalité
Aiko~5,99 $ unique100 %Glisser-déposer très simple
Whisper Notes6,99 $ unique100 %Dictée système via Fn
Whisper TranscriptionFreemium (abonnement)iPhone 13+Résumé IA, chat avec transcription
Just Press Record~4,99 $PartielUn seul appui, Apple Watch, iCloud sync
Whisper: Speech to TextFreemiumVariableInterface simple pour enregistrement+transcription

Android

ApplicationPrixHors ligneFonctionnalité
Voice NotebookGratuit + PremiumAvec pack de langueMeilleure dictée, note 4.8
SpeechnotesGratuit, 5M+ téléchargementsLimitéClavier de ponctuation breveté
SpeechTexterGratuit, 80+ languesNonVoice-to-text basique
Notely VoiceGratuit, sans publicitéOuiWhisper sur smartphone pour notes longues

Multiplateforme

ApplicationPlateformesPrixMultilingue
TranskriptoriOS/Android/Web/Chrome/Firefox9,99–30 $/moisOui
NottaiOS/Android/WebGratuit 120 min/mois (3 min/conversation)Qualité variable
VomoiOS/AndroidFreemiumNotes vocales + IA

Tableau récapitulatif : choix par cas d'utilisation

ScénarioMeilleur choixPrixMultilingue
Dictée rapide dans n'importe quel champHandy, Whisper NotesGratuit / 6,99 $Whisper
Transcription de fichiers hors ligneVibe, BuzzGratuitWhisper
GUI soignée pour macOSMacWhisper Pro79,99 $ à vieWhisper
Accélération GPU sous WindowsWhisperDesktop, WhisperUIGratuitWhisper
Sous-titres pour vidéoSubtitle Edit + WhisperGratuitWhisper
Éditeur vidéo + sous-titresCapCutGratuitOui
Serveur self-hostedWhishperGratuitWhisper
Temps réel (live)WhisperLiveGratuitWhisper
Transcription humaineGoTranscript1,20–2,75 $/minLocuteurs natifs
Mobile iOSAiko~5,99 $Whisper
Mobile AndroidVoice NotebookGratuitGoogle STT
Contenu à partir d'enregistrementsWhisperTranscribe~15 $/mois57+ formats

FAQ

Quelle est la meilleure application gratuite pour la transcription ?

Pour le bureau, les meilleures options gratuites sont Vibe et Buzz — toutes deux basées sur Whisper et entièrement hors ligne. Pour la transcription en ligne sans installation, essayez TurboScribe (3 fichiers par jour jusqu'à 30 minutes gratuitement) et GigaChat de Sber (téléchargement audio jusqu'à 2 heures avec diarisation et résumé).

Peut-on transcrire de l'audio hors ligne sans internet ?

Oui. Toutes les applications de bureau basées sur Whisper (Vibe, Buzz, MacWhisper, WhisperDesktop) fonctionnent entièrement hors ligne une fois le modèle téléchargé. Vos données ne quittent pas l'ordinateur, ce qui garantit une confidentialité totale.

Quelles applications reconnaissent le mieux la langue russe ?

La meilleure précision pour le russe est offerte par GigaAM de Sber (8,4 % WER). Parmi les outils gratuits grand public, on trouve GigaChat (téléchargement audio) et Yandex SpeechKit (API entreprise, 95–97 % de précision). Les applications basées sur Whisper offrent une qualité acceptable (~84 % de précision pour le russe).

Quelle application mobile choisir pour la transcription sur téléphone ?

Sur iOS, les meilleures options sont Aiko (~5,99 $, entièrement hors ligne) et Whisper Notes (6,99 $, dictée à l'échelle du système). Sur Android, Voice Notebook est en tête (gratuit, note 4,8, meilleure dictée en russe via Google STT).

Comment mettre en place son propre serveur de transcription ?

La meilleure option self-hosted est Whishper : une plateforme complète avec interface web, déployée via Docker Compose, incluant la transcription via faster-whisper, la traduction de sous-titres et un éditeur intégré. Pour la transcription en temps réel, essayez WhisperLive de Collabora.