Transcrição para o mercado da CEI: aplicativos e ferramentas
Revisão completa de aplicativos e ferramentas para transcrição de fala: GUIs de desktop baseadas em Whisper, soluções self-hosted, editores de vídeo com transcrição integrada, serviços de navegador e aplicativos móveis para iOS e Android. Todas as opções — desde open-source totalmente gratuito até versões pagas com funcionalidades avançadas.
Aplicativos de desktop: Whisper com rosto humano
Para quem precisa de uma GUI simples sem linha de comando, surgiu todo um ecossistema de aplicativos de desktop baseados em Whisper. Todos funcionam offline, os dados não saem do computador — saiba mais em «Transcrição local vs. na nuvem».
Handy (handy.computer) — aplicativo open-source gratuito para macOS/Windows/Linux com uma abordagem única: ditado push-to-talk diretamente em qualquer campo de texto. Pressione a tecla de atalho → fale → solte → o texto é inserido na janela ativa. Ideal para substituir o teclado na digitação, mensagens e anotações. Construído sobre Whisper, totalmente offline e privado. Patrocinado por Wordcab e Bolt AI.
Vibe (thewh1teagle.github.io/vibe) — uma das melhores soluções open-source gratuitas, com mais de 5.000 estrelas no GitHub. Multiplataforma (Windows, macOS, Linux), construído com Tauri + whisper.cpp. Suporta aceleração por GPU (NVIDIA, AMD, Apple Silicon via Vulkan/CoreML), mais de 90 idiomas, diarização de falantes, exportação para SRT/VTT/TXT/DOCX/PDF/JSON, transcrição de links do YouTube via yt-dlp, gravação por microfone, sumarização via Claude/Ollama, API HTTP com documentação Swagger e até modo CLI. O cliente de desktop gratuito mais funcional da atualidade. Instalador ~24 MB, após instalação ~87 MB + modelo.
Buzz (buzzcaptions.com) — GUI open-source gratuita para Whisper. Multiplataforma, suporta vários backends (whisper.cpp, faster-whisper), separação de falantes, exportação de legendas. Mais minimalista que o Vibe, mas estável e testado.
MacWhisper / Whisper Transcription (App Store, macupdate.com) — aplicativo nativo para macOS. A versão gratuita inclui os modelos Base e Small. Assinatura Pro: $4,99/semana, $8,99/mês, $29,99/ano ou $79,99 permanente. O Pro libera modelos Medium e Large, processamento em lote, gravação de áudio do sistema (chamadas Zoom, podcasts), separação de falantes, Reader Mode, integração com ChatGPT para sumarização. A interface Whisper mais polida para Mac. Avaliação ~4,0 no MacUpdate.
Whisper Notes (whispernotes.app) — $6,99 pagamento único para iOS + Mac. Mais de 60.000 usuários. Recurso principal — ditado em todo o sistema: mantenha pressionado Fn em qualquer aplicativo → fale → solte → o texto é inserido. Importação de arquivos de áudio/vídeo com resultado em streaming. Totalmente offline, usa Whisper Large V3 Turbo no Apple Silicon.
WhisperDesktop (github.com/Const-me/Whisper) — aplicativo Windows gratuito com aceleração GPU via DirectCompute/GPGPU. Significativamente mais rápido que o Whisper original: 3:24 min de áudio em 19 segundos no GeForce 1080Ti (contra 45 segundos do PyTorch+CUDA). Transcrição de arquivos + gravação por microfone em tempo real. Modelo recomendado: ggml-medium.bin (~1,42 GB).
WhisperUI (Microsoft Store) — aplicativo Windows gratuito. Aceleração GPU via CPU, OpenCL, NVIDIA CUDA 11/12. Totalmente offline, exportação de legendas em SRT/VTT, processamento em lote.
Aiko (~$5,99, iOS/Mac) — aplicativo Whisper maximamente simples para Apple. Arraste e solte o arquivo de áudio → texto. 100% no dispositivo, ideal para quem quer transcrição com um botão sem configurações.
Whisper Transcription (iOS App Store, freemium) — aplicativo móvel com modo no dispositivo e na nuvem. Share Extension permite transcrever mensagens de voz do iMessage, WhatsApp, Voice Memos. Requer iPhone 13+ para modo no dispositivo. Sumarização por IA, chat com transcrição. Avaliação 4,6+.
Soluções self-hosted: para o seu próprio servidor
Para quem deseja implantar um serviço completo de transcrição em seu próprio servidor ou rede local.
Whishper (github.com/pluja/whishper) — plataforma self-hosted completa com interface web. Inclui faster-whisper para transcrição, LibreTranslate/Argos Translate para tradução de legendas (mais de 60 idiomas), editor de legendas integrado, exportação para JSON/TXT/VTT/SRT. Implantação via Docker Compose (5 contêineres: API, backend, frontend, tradução, MongoDB). 100% offline após a instalação. Excelente opção para equipes que precisam de um serviço privado sem nuvem.
WhisperLive (github.com/collabora/WhisperLive, Collabora) — solução open-source para transcrição em tempo real. Servidor WebSocket: conecte o microfone ou arquivo → receba texto com latência mínima. Suporta backends faster-whisper, TensorRT e OpenVINO. Cliente Python e demo JS. Adequado para transcrição ao vivo de reuniões e conferências.
WhisperTranscribe (whispertranscribe.com) — serviço em nuvem com aplicativo de desktop para Windows. Teste gratuito de 60 minutos sem necessidade de cartão. Usa Whisper + AssemblyAI. Além da transcrição: mais de 57 tipos de conteúdo a partir de uma gravação (posts, resumos, materiais de marketing), treinamento de IA no estilo do usuário, transcrição de YouTube/Vimeo por link, podcasts de uma biblioteca de 2,5 milhões. Mais de 55 idiomas. Assinatura ~$15/mês.
Editores de vídeo com transcrição integrada
Categoria separada — editores de vídeo que podem transcrever áudio como parte do fluxo de trabalho.
CapCut (ByteDance/TikTok) — editor de vídeo gratuito com poderosa função Auto Captions. Suporta mais de 100 idiomas, incluindo português. Transcreve fala em legendas, permite editar vídeo com base no texto (transcript-based editing), traduzir legendas, criar legendas bilíngues. Versão web, desktop (Windows/Mac), aplicativos móveis. Gratuito. Limitação: orientado para legendas, não para documentos de transcrição completos.
Descript — poderoso editor de áudio/vídeo com transcript-based editing (exclua uma palavra do texto → ela é cortada do vídeo). Não suporta russo — apenas caracteres latinos. Mencionado para completude.
DaVinci Resolve (Blackmagic Design) — editor de vídeo profissional com transcrição integrada via Whisper. Suporta russo, mas a qualidade é inferior às ferramentas especializadas. Versão gratuita disponível. Transcrição na linha do tempo para text-based editing.
Subtitle Edit (nikse.dk) — editor de legendas gratuito e open-source para Windows (parcialmente Linux) com transcrição integrada via Whisper. Suporta mais de 7 motores Whisper (OpenAI Whisper, Purfview's Faster-Whisper-XXL, CPP, CPP cuBLAS, Const-me, CTranslate2, stable-ts, WhisperX), processamento em lote, tradução automática, mais de 100 idiomas. A ferramenta gratuita mais poderosa para criar legendas a partir de áudio. No RTX A6000 — 2 horas em poucos minutos.
Subper / SubtitleWhisper (subtitlewhisper.com) — gerador de legendas online baseado em Whisper + Silero VAD. Editor de legendas online. Plano gratuito limitado, pago a partir de $9,99/mês. Integração GPT para pontuação e paragrafação.
Extensões de navegador e ferramentas online
Transkriptor — aplicativo web + extensão para Chrome/Firefox + iOS/Android. Suporta russo, diarização automática, exportação para TXT/SRT/DOCX. Teste gratuito, depois $9,99–30/mês. Alega 99% de precisão (para russo, a real é menor).
TurboScribe (turboscribe.ai) — serviço web com 3 transcrições gratuitas por dia (até 30 min cada). Russo na lista de idiomas com «Excellent Accuracy». Planos pagos a partir de ~$10/mês. Whisper por baixo.
Wonderscribe — serviço web totalmente gratuito, mas com taxa de erros elevada (~16% WER). Para transcrição de rascunho.
HuggingFace Spaces (huggingface.co/spaces/openai/whisper) — demo Whisper gratuito da OpenAI. Carregue o arquivo → receba o texto. Gratuito, mas com limitações e filas.
Speech2Text.ru — serviço russo, 3 horas gratuitas com diarização de falantes.
Any2Text.ru — serviço russo, 15 minutos sem registro + 60 minutos com registro. Suporta transcrição de vídeo do VKontakte por link.
Aplicativos móveis
iOS
| Aplicativo | Preço | Offline | Destaque |
|---|---|---|---|
| Aiko | ~$5,99 único | 100% | Drag-and-drop mais simples |
| Whisper Notes | $6,99 único | 100% | Ditado em todo o sistema via Fn |
| Whisper Transcription | Freemium (assinatura) | iPhone 13+ | Sumarização por IA, chat com transcrição |
| Just Press Record | ~$4,99 | Parcial | Um toque, Apple Watch, iCloud sync |
| Whisper: Speech to Text | Freemium | Varia | Interface simples para gravação+transcrição |
Android
| Aplicativo | Preço | Offline | Destaque |
|---|---|---|---|
| Voice Notebook | Gratuito + Premium | Com pacote de idioma | Melhor ditado em russo, avaliação 4,8 |
| Speechnotes | Gratuito, 5M+ downloads | Limitado | Teclado de pontuação patenteado |
| SpeechTexter | Gratuito, 80+ idiomas | Não | Voice-to-text básico |
| Notely Voice | Gratuito, sem anúncios | Sim | Whisper no smartphone para notas longas |
Multiplataforma
| Aplicativo | Plataformas | Preço | Russo |
|---|---|---|---|
| Transkriptor | iOS/Android/Web/Chrome/Firefox | $9,99–30/mês | Sim |
| Notta | iOS/Android/Web | Gratuito 120 min/mês (3 min/conversa) | Qualidade discutível |
| Vomo | iOS/Android | Freemium | Notas de voz + IA |
Tabela resumo: escolha por cenário de uso
| Cenário | Melhor opção | Preço | Russo |
|---|---|---|---|
| Ditado rápido em qualquer campo | Handy, Whisper Notes | Gratuito / $6,99 | Whisper |
| Transcrição de arquivos offline | Vibe, Buzz | Gratuito | Whisper |
| GUI polida para macOS | MacWhisper Pro | $79,99 permanente | Whisper |
| Aceleração GPU no Windows | WhisperDesktop, WhisperUI | Gratuito | Whisper |
| Máxima precisão em RU | GigaChat (carregar áudio) | Gratuito | GigaAM |
| Bot do Telegram | Voxbrief (@VidVKYT2AudioBot) | Gratuito | YouTube, VK |
| Reuniões Google Meet/Teams | Legendas integradas | Incluído na assinatura | Sim |
| Legendas para vídeo | Subtitle Edit + Whisper | Gratuito | Whisper |
| Editor de vídeo + legendas | CapCut | Gratuito | Sim |
| Servidor self-hosted | Whishper | Gratuito | Whisper |
| Tempo real (ao vivo) | WhisperLive | Gratuito | Whisper |
| Transcrição humana | GoTranscript | $1,20–2,75/min | Nativos |
| API Enterprise (otimizado para RU) | Yandex SpeechKit | ~₽0,64/min | 95-97% |
| API Enterprise (econômico) | Tinkoff VoiceKit | ~₽0,40/min | ~95% |
| Serviço russo tudo-em-um | Войси | 45 min gratuito | 98% |
| Móvel iOS | Aiko | ~$5,99 | Whisper |
| Móvel Android | Voice Notebook | Gratuito | Google STT |
| Conteúdo a partir de gravações | WhisperTranscribe | ~$15/mês | 57+ formatos |
| Web russo sem registro | Any2Text.ru | 15 min gratuito | Sim |
FAQ
Qual é o melhor aplicativo gratuito para transcrição?
Para desktop, as melhores opções gratuitas são Vibe e Buzz — ambos baseados no Whisper e totalmente offline. Para transcrição online sem instalação, experimente o TurboScribe (3 arquivos por dia de até 30 minutos grátis) e o GigaChat da Sber (upload de áudio de até 2 horas com diarização e resumo).
É possível transcrever áudio offline sem internet?
Sim. Todos os aplicativos de desktop baseados no Whisper (Vibe, Buzz, MacWhisper, WhisperDesktop) funcionam totalmente offline após o download do modelo. Seus dados não saem do computador, garantindo privacidade total.
Quais aplicativos reconhecem melhor o idioma russo?
A maior precisão para russo é oferecida pelo GigaAM da Sber (8,4% WER). Entre as ferramentas gratuitas para consumidores, destacam-se GigaChat (upload de áudio) e Yandex SpeechKit (API empresarial, 95–97% de precisão). Apps baseados no Whisper oferecem qualidade aceitável (~84% de precisão para russo).
Qual aplicativo móvel escolher para transcrição no celular?
No iOS, as melhores opções são Aiko (~US$ 5,99, totalmente offline) e Whisper Notes (US$ 6,99, ditado em nível de sistema). No Android, o líder é o Voice Notebook (gratuito, avaliação 4,8, melhor ditado em russo via Google STT).
Como configurar meu próprio servidor de transcrição?
A melhor opção self-hosted é o Whishper: uma plataforma completa com interface web, implantada via Docker Compose, com transcrição pelo faster-whisper, tradução de legendas e editor integrado. Para transcrição em tempo real, experimente o WhisperLive da Collabora.